CodeGemma と RecurrentGemma の概要
以下の記事が面白かったので、簡単にまとめました。
1. Gemmaのモデルバリアント
「Gemma」は、「Gemini」の作成に使用されたものと同じ技術に基づいて構築された、軽量で最先端のオープンモデルです。
2024年4月、「Gemma」の2つのモデルバリアントをリリースしました。
2. CodeGemma
「CodeGemma」は、コード補完とコード生成タスクに特化した7Bの事前学習済みモデルと、高速コード補完用の 2Bの事前学習済みモデルを提供します。
利点は、次のとおりです。
詳細については、レポートまたはクイックスタートガイドを参照してください。
3. RecurrentGemma
「RecurrentGemma」は、より大きなバッチサイズでの効率的で高速な推論が可能なモデルです。リカレントニューラルネットワークとローカルアテンションを活用してメモリ効率を向上させています。「Gemma 2B」と同様のベンチマークスコアを達成しながら、「RecurrentGemma」の独自のアーキテクチャにより、次のような利点が得られます。
基礎となる技術を理解するには、論文を参照してください。調査するには、モデルをファインチューニングする方法を示すノートブックを試してください。
4. Gemma 1.1
新しいモデルバリアントと並行して、パフォーマンスの向上を含む「Gemma 1.1」をリリースしました。さらに、開発者のフィードバックに耳を傾け、バグを修正し、柔軟性を高めるために規約を更新しました。