見出し画像

Gemma 2 の 概要

以下の記事が面白かったので、簡単にまとめました。

Gemma 2 is now available to researchers and developers


1. Gemma 2

本日 (2024年6月27日)、「Gemma 2」の9B27Bがリリースされました。第1世代よりもパフォーマンスが高く、推論の効率も高く、安全性が大幅に向上しています。

特徴は、次のとおりです。

・パフォーマンス
「Gemma 2」の27Bはクラス最高のパフォーマンスを発揮し、2倍以上のサイズのモデルにも匹敵します。9Bもクラス最高のパフォーマンスを発揮します。詳細しくは、テクニカルレポートを参照してください。

・効率性とコスト削減
「Gemma 2」の27Bは、単一の「Google Cloud TPU ホスト」「NVIDIA A100 80GB Tensor Core GPU」「NVIDIA H100 Tensor Core GPU」でフル精度で効率的に推論を実行するように設計されており、高いパフォーマンスを維持しながらコストを大幅に削減します。

・高速推論
「Gemma 2」は、さまざまなハードウェアで驚異的な速度で実行できるように最適化されています。「Google AI Studio」で「Gemma 2」をフル精度で試したり、CPU上の「Gemma.cpp」で量子化バージョンを使用してローカルパフォーマンスを解き放ったり、「HuggingFace Transformers」を介して「NVIDIA RTX」「GeForce RTX」を搭載した自宅のコンピュータで試したりできます。

2. Gemma 2 の統合

「Gemma 2」は強力であるだけでなく、ワークフローに簡単に統合できるように設計されています。

・オープンでアクセス可能
「Gemma 2」は第1世代と同様に、商用に適した Gemma licenseの下で利用可能です。開発者や研究者はイノベーションを共有し、商用化することができます。

・幅広いフレームワーク互換性
「Gemma 2」は、Keras 3.0、vLLM、Gemma.cpp、Llama.cpp、Ollama を介して、HuggingFace Transformers、JAX、PyTorch、TensorFlow などの主要なAIフレームワークと互換性があります。

・簡単な導入
来月から、Google Cloud ユーザーは「Vertex AI」上で「Gemma 2」を簡単に導入および管理できるようになります。

Gemma Cookbook」を参照してください。これは、「Gemma 2」をファインチューニングするためのガイドです。RAGなどの一般的なタスクを含め、選択したツールで「Gemma」を簡単に使用する方法を学びます。

3. 責任あるAI開発

Googleでは「Responsible Generative AI Toolkit」を通じて、開発者や研究者が責任を持ってAIを構築および展開するための必要なリソースを提供に取り組んでいます。最近オープンソース化された「LLM Comparator」は、開発者や研究者が言語モデルを詳細に評価するのに役立ちます。本日から、companion Pythonライブラリを使用してモデルとデータの比較評価を実行し、結果をアプリで視覚化できます。さらに、「Gemma」用のテキスト透かし技術である「SynthID」のオープンソース化に積極的に取り組んでいます。

「Gemma 2」を学習する際、堅牢な社内安全プロセスに従い、事前学習データをフィルタリングし、包括的な一連の指標に対して厳格なテストと評価を実行して、潜在的なバイアスとリスクを特定して軽減しました。安全性と表現上の害に関連する大規模な公開ベンチマークの結果も公開しています。

4. Gemmaで構築されたプロジェクト

Navarasa」は、「Gemma」で作成したインドの言語の多様性に根ざしたモデルです。

より幅広いAIタスクと課題に取り組むために、新しいアーキテクチャを探求し、特殊なGemmaバリアントを開発し続けています。これには、近日公開予定の 2.6Bパラメータの「Gemma 2」が含まれます。詳しくは、テクニカルレポートをご覧ください。

5. Gemma 2 をはじめる

「Gemma 2」は、現在「Google AI Studio」で利用できるため、ハードウェア要件なしで27Bの完全なパフォーマンス機能をテストできます。また、KaggleHuggingFaceから「Gemma 2」のウェイトをダウンロードすることもできます。「Vertex AI Model Garden」は近日中に提供される予定です。



いいなと思ったら応援しよう!