Gemma2 9Bは日本語も強いかもしれない

2024年6月28日 09:38

はじめに

Gemma2がollamaで利用可能になったため、9Bモデルをローカルで試してみました。（gemma2:9b-instruct-q6_K）

Gemma2とは

Gemma 2は、Googleの最新世代のオープンソースLLMです。90億と270億のパラメータの2つのサイズで、ベース（事前学習済み）とインストラクションチューニング済みバージョンが用意されています。GemmaはGoogle Deepmind Geminiに基づいており、コンテキスト長は8Kトークンです。

* gemma-2-9b: ベースの9Bモデル
* gemma-2-9b-it: ベースの9Bモデルのインストラクションチューニング済みバージョン
* gemma-2-27b: ベースの27Bモデル
* gemma-2-27b-it: ベースの27Bモデルのインストラクションチューニング済みバージョン

Gemma 2モデルは、最初のバージョンよりも約2倍のデータでトレーニングされました。27Bバージョンの場合は13兆トークン、9Bバージョンの場合は8兆トークンのウェブデータ（主に英語）、コード、数学のデータを使用しました。トレーニングミックスの詳細な内容は不明であり、より大きく、慎重にキュレーションされたデータがパフォーマンス向上に大きく貢献したと推測できます。

Gemma 2は、最初のバージョンと同じ許諾証の下で提供されています。これは、再配布、微調整、商用利用、派生作品の許可を含む許容的なライセンスです。

https://huggingface.co/blog/gemma2 の内容をGemma2 9B で日本語翻訳

性能チェック

いまだかつて一度もLLMで１００点の回答を得た事のない質問に関して、一発で１００点満点を出しました。（※ RAGも含めて事前知識なし）

まどか☆マギカのあらすじを教えて

by 筆者

まどか☆マギカは、中学生の鹿目まどかが、魔女と戦う魔法少女になる物語です。まず、まどかの日常について知りたいですか？それとも、魔法少女になるきっかけについて知りたいですか？

by Gemma2 9B

魔法少女になるきっかけを知りたいです。

by 筆者

まどかは、幼馴染の美樹さやかと、新しいクラスメイトの暁美ほむらに出会います。

ほむらは、まどかに不思議な力を与える「ソウルジェム」と、魔女と戦うための「魔法」を教えます。

まどかは、ほむらの言葉に惹かれ、魔法少女になることを決意します。

この決意が、まどかの運命を変えていくのです。

by Gemma2 9B

まどかの運命はどうなるのですか？

by 筆者

まどかの魔法少女としての活動は、最初は希望に満ちていました。

しかし、次第に魔女との戦いは、まどかに大きな苦しみと犠牲をもたらしていきます。

まどかの運命は、魔法少女としての活動と、大切な人々との関係が複雑に絡み合い、悲劇的な方向へと進んでいくのです。

by Gemma2 9B

確かに知識としてのLLMの正しさはあまり評価として意味がないものかもしれませんが、質問に対してすべて的確に正しく答えました。これは9BモデルでChatGPT-4に（日本語で）匹敵するという噂は本当かもしれません。

ちなみに他のモデルでは、

まどか☆マギカは、2011年に放送された日本のテレビアニメ作品です。物語は、魔法少女たちが悪い精霊を倒し、世界を守るという伝統的な魔法少女ものから大きくかけ離れた独自の世界観を持っています。

物語は、転校生であるまどか・チャンとその友人たちによって進められます。彼らは「法の使徒」として、悪い精霊を倒し、世界を守る役割を果たします。しかし、まどkaの行動がこの世界に深刻な影響を及ぼすことになり、物語は彼女の選択とその結果によって進んでいきます。

アニメは、友情、愛情、命の価値など、様々なテーマを取り扱っています。また、過去、現在、未来の三つの時間軸が絡み合う複雑なストーリー展開も特徴です。

by lightblue suzume (Meta llama3 7b)

「映画『劇場版魔法少女まどか☆マギカ』は、2013年に公開された日本のアニメーション映画です。この物語は、主人公の鹿目まどか（声：悠木碧）とその仲間たちが魔法少女になり、さまざまな謎を解き明かすアニメシリーズ「魔法少女わるも☆マギカ」をベースにしています。

物語は、地球外生命体との戦争である「ウィッチハント（Witch Hunt）」から始まります。主人公の鹿目まどかは、謎の呪いによって眠った状態の少女として発見されることで物語が動き出します。そこに現れた魔法少女のリコ・マミ・ホイップスティックらと契約を結び、戦う力を得るも、それは激しい負担であることがわかります。

ウィッチハントの過去につながっていた少女キュゥべえ（声：喜多村英梨）は、鹿目まどかを特別な存在と認め、戦争の真実を告げる。魔法少女は自分たちの力で世界の終わりを回避しようと奮闘する一方で、それぞれの感情や友情が試されます。

魔法少女になることは「選択」であり、その結果は重大な意味を持つと同時に個々人の過去と未来にも深く関わっています。

謎めいた出来事や秘密が次第に明らかになり、登場人物たちはそれぞれに内面を問うことになります。最後の戦闘では、ウィッチハントが地球外生命体である「ワルプルギスト」への反撃を行い、世界を守ろうとしていたキュゥべえの真意や自らに対する苦悩が明かされます。

この物語は、友情、愛、選択、犠牲など多くのテーマを掘り下げています。ストーリーが進むにつれ、視聴者を魅了し続ける感動的で哀愁あふれるエンディングは、多くのファンから高い評価を得ており、「魔法少女まどか☆マギカ」の名作として今もなお愛され続けています。

by Microsoft Phi3 14B

『まどか☆マギカ』は、A-1 Picturesによって制作された日本のアニメーションです。ストーリーは中学生の美咲・まどかと彼女のクラスメイトたちが「魔法使い」という新種の神に出会い、世界を守るために挑む物語です。

舞台は現代の東京で、まどかはクラスで人気のある女子高生ですが、友人たちや家族との生活には悩みを持っています。ある日、彼女たちは学園祭で「魔法使い」という新種の神に出会います。「魔法使い」は人々が願いを叶えるために力を行使し、その代わりに彼ら自身の魂が奪われるという存在です。

まどかは「魔法使い」の困難さとリスクを理解し、彼女の友達たちはそれぞれ異なる選択を行います。彼女たちは友情や家族愛、人間性について深く考え、自分たちの願いを探します。最終的には、まどかがその全てに対する答えを見つけることになるのです。

ストーリーは、魔法使いをめぐる友情と選択の重さ、そしてそれぞれのキャラクターが抱える葛藤に焦点を当てています。物語は複雑なテーマを巧みに扱いながらも、感動的な展開で視聴者に深く心に響きます。

by Alibaba Qwen2 7b

筆者の経験として、日本語（ローカル）LLM最強はQwen2でしたが、正味の日本語能力はGemma2の能力の方がかなり上かもしれません。

ただし、Gemma2 (9b) の扱えるトークン数が8kなので、Qwen2 (筆者ハード環境では24k・モデル最大32k）はやはり強いです。※ RAGを利用すると大量に利用できるトークンを消費するので、最大32kはかなり利用できます。

【以下PRです】

ollama Open WebUIの使い方

各種AIソフトウェアのインストール方法

Gemma2 9Bは日本語も強いかもしれない

はじめに

Gemma2とは

性能チェック

いいなと思ったら応援しよう！