
Gemini-1.5-Pro-002・Gemini-1.5-Flash-002・Gemini-1.5-Flash-8B-Exp-0924 の概要
以下の記事が面白かったので、簡単にまとめました。
・Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, and more
1. Gemini-1.5-Pro-002 ・ Gemini-1.5-Flash-002
本日 (2024年9月24日)、「Gemini-1.5-Pro-002」と「Gemini-1.5-Flash-002」をリリースしました。数学、長いコンテキスト、視覚の面で大きな進歩があり、全体的な質が向上しました。「Google AI Studio」「Gemini API」で利用できます。
MMLU-Pro では、約7%の向上が見られました。MATH および HiddenMath では、両方のモデルで約20%の大幅な改善が見られました。ビジョンとコードのユースケースでは、視覚的理解とPythonコード生成を測定する評価全体で、両方のモデルのパフォーマンスも向上しました (約 2-7% の範囲)。

また、コンテンツの安全性に関するポリシーと基準を引き続き遵守しながら、模範回答の全体的な有用性も向上させました。これにより、多くのトピックで、回答の先送りや拒否が減り、より有用な回答が提供されるようになりました。
開発者のフィードバックに応えて、両方のモデルはより簡潔なスタイルになりました。これは、これらのモデルをより使いやすくし、コストを削減することを目的としています。要約、質問への回答、抽出などのユースケースでは、更新されたモデルのデフォルトの出力長は、以前のモデルよりも約 5 ~ 20% 短くなっています。モデルをより詳細かつ会話的にする方法については、プロンプト戦略ガイドを参照してください。
2. 価格の引き下げ、レート制限の引き上げ、速度改善、フィルター設定の更新
2-1. 価格引き下げ
2024年10月1日より、「Gemini 1.5 Pro」では価格が 50% 以上引き下げられます (プロンプトの入力と出力の両方が 128K 未満)。

2-2. レート制限の引き上げ
「Gemini 1.5 Flash」ではレート制限が2倍、「Gemini 1.5 Pro」ではレート制限が約3倍に増加しました。今後数週間で、Gemini API レート制限を引き続き引き上げていく予定です。
2-3. 速度改善
最新モデルのコア改善に加え、過去数週間にわたり、「Gemini 1.5 Flash」でレイテンシを削減し、2倍の出力速度と3倍少ないレイテンシーを実現しました。

2-4. フィルター設定の更新
2023年12月に「Gemini」がリリースされて以来、安全で信頼性の高いモデルの構築が重要な焦点となってきました。最新版の「Gemini」 (-002) では、安全性とバランスを取りながらユーザーの指示に従うモデルの機能が改善されています。開発者がGoogleのモデルに適用できる一連の安全性フィルターを今後も提供していきます。本日リリースされたモデルでは、フィルターはデフォルトでは適用されないため、開発者はユースケースに最適な構成を決定できます。
3. Gemini-1.5-Flash-8B-Exp-0924
「Gemini-1.5-Flash-8B-Exp-0924」は、8月に発表した「Gemini-1.5-Flash-8B」の改良版です。テキストとマルチモーダルの両方でパフォーマンスが大幅に向上しています。現在、「Google AI Studio」と「Gemini API」から利用できます。また、「Gemini Advanced」ユーザーは、チャットに最適化された「Gemini 1.5 Pro-002」にすぐにアクセスできるようになります。