見出し画像

Gemini 1.5 Flash-8B の概要

以下の記事が面白かったので、簡単にまとめました。

Gemini 1.5 Flash-8B is now production ready


1. Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B」の安定版がリリースされました。「Google AI Studio」と「Gemini API」を介して「gemini-1.5-flash-8b」無料でアクセスできます。

・50%安い価格 (1.5 Flash と比較)
・レート制限が2倍に向上 (1.5 Flash と比較)
・小さなプロンプトでのレイテンシが低い (1.5 Flash と比較)

多くのベンチマークで5月にリリースされた「Gemini 1.5 Flash」の性能に匹敵します。チャット、文字起こし、長いコンテキストの言語翻訳などのタスクで特に優れた性能を発揮します。

2. 使用料金

「Gemini」の中で安い価格が実現しました。有料プランは、10月14日から開始されます。

・100万入力トークンあたり $0.0375
・100万出力トークンあたり $0.15
・100万トークンあたり $0.01 ドル

※128K以下のプロンプトの場合

3. レート制限

「Gemini 1.5 Flash-8B」は、シンプルで高ボリュームのタスクに最適です。レート制限は2倍に向上し、1分あたり最大4,000件のリクエスト (RPM) が可能になりました。



いいなと思ったら応援しよう!