
Googleが極秘に語る。勝者はChatGPTでもGoogle Bardでもないという内部文書
前回rinnaというLLMをご紹介したので、シリーズ【ChatGPTの歴史】をちょっと脱線して補足的な記事を書きます。
本日の記事は生成AI界隈の人は全員知っていることですが、年末年始のChatGPTフィーバーのイメージそのままにChatGPTの話題をなんとなく追っかけている人は案外知らない驚愕の事実かもしれません。
昨日の記事のコメント欄でも頂いたのですが、rinnnaっていうのを初めて知った、という方も多かったのかなと思いました。
現在日本では、ホットな話題に限っても、下記の3つのChatGPTベースのLLMが日本版ChatGPTとして有力視されています。いま、みなさんが使っているブラウザのChatGPTではありません。
サイバーエージェント、rinna、レトリバ。どれが一番すごい?
— みこちゃんのAI勝つ妖術(活用術) (@yukkymarketing) July 1, 2023
(^-^)
最近公開された日本語LLMを要約生成タスクで検証してみる|朝日新聞社 メディア研究開発センター @asahi_ictrad #note https://t.co/ScImdd0jG8
本家の人気はそろそろ陰り気味ということも、もしかすると知らない方も多いかもしれません。
やっぱり感がある。
— みこちゃんのAI勝つ妖術(活用術) (@yukkymarketing) July 1, 2023
「23年1月の伸び率は前月比131.6%だったが、2月は62.5%、3月は55.8%と徐々に落ち、4月は12.6%、5月には2.8%まで落ち込んだ。6月の伸び率はマイナスになる可能性すらあるという。」
» ChatGPT、アクセス数の伸び率鈍化 6月はマイナスの可能性 | 36K https://t.co/4U97b8oE97
伸び率マイナスというのが一瞬わかりにくいですが、要するにもうChatGPTは頭打ちっぽいということです。早すぎる(゚0゚)。
じゃあ、今度はChatGPTじゃなくてBardか!?と思う人も多いでしょう。ところがこれまた違うのです。
Googleの内部文書が流出しています。
Googleは「GoogleおよびOpenAIは次の軍拡競争に勝てる立場にない」としています。Google、OpenAI、Metaなどの企業がシェアを巡って争う中、一人勝ちするのは「オープンソース」だというのがGoogleの分析です。
GoogleのBardもChatGPTもオープンソースではないです。APIで外から自分なりに利用することはできるのですが、中身は完全にブラックボックスです。例えばGAFAの一角であるMeta(旧フェイスブック)はオープンソース戦略を取っています。
Googleが、GoogleもOpenAIも勝てないと言った時頭にあった具体名が、MetaのLLaMAです。このLLaMAを巡ってはオープンソースで発表されてからわずか数週間で、LLaMA自体を上回るような別種の改良版LLaMAが公開されました(「Vicuna-13B」という名前)。
Googleでは、当初MetaのLLaMAには勝てない、と言っていたに過ぎないのですが、LLaMAがソースコードをオープンにして自由に改良していいよ、とした瞬間、GoogleやOpenAIが何年もかけて数百万ドルつぎ込んで作りあげたLLMと同等のものが数週間でもうひとつできてしまったのです。
ということは、今後週単位に一つ、ChatGPTレベルのものがどんどん生み出される可能性があるということですね。毎月4個程度新しいChatGPT、新しいBardが世の中に出てくる。
たしかに、今現実にそんな状況になっています。毎週1個は何かしら新しいのが出てる感じがする。ChatGPTが唯一無二のすげー生成AIで、Bardがそれを打ち負かそうとしている、というのは、まったく現実とはかけ離れた空想です。ChatGPT vs Brad、あるいはOpenAI vs Googleの覇権争い、と現状を認識している専門家は今現在の時点ですでに一人もいないのです。
その図式で生成AIを語っている人は古すぎて話になりません。 当のGoogleやOpenAIはあせりまくってます。
その懸念、恐怖が下記の言葉となっています。
こうしたオープンソースの大規模言語モデルが登場したことについて、Googleは「私たちのモデルは品質という点ではまだ若干の優位性を持っていますが、その差は驚くほど早く縮まっています。オープンソースのモデルは、より速く、よりカスタマイズ可能で、よりプライベートで、1ポンド当たりの性能は優れています。私たちが1000万ドルと5400億のパラメーターでなんとかやっていけているところを、Vicuna-13Bは100ドルと130億のパラメーターでやってのけているのです。しかも、数カ月ではなく、数週間でやってのけました。このことは、私たちにとっても大きな意味を持ちます」と指摘。
昨日はrinnaが日本語LLMでは注目すべきモデルだと書きました。では世界の状況ではどうでしょう。みこちゃんは世界規模で見ると、この団体が現在、もっとも有力ではないかなと思っています。
NowBrowsing: 無料で商用利用もOKな完全オープンソースの大規模言語モデルを開発するプロジェクト「RedPajama」がトレーニングデータセットを公開 - ライブドアニュース https://t.co/cYebflSiwa
— みこちゃんのAI勝つ妖術(活用術) (@yukkymarketing) April 25, 2023
これについては、意見が分かれるでしょう。その他にもほんといっぱいありすぎるほどありすぎますから。ですので、その簡単な見取り図もここに引用しておきます。
— みこちゃんのAI勝つ妖術(活用術) (@yukkymarketing) June 5, 2023
生成AIを語る人は、そろそろChatGPT一色ではなく、ChatGPTが他のLLMと比べてどのような強味と弱味を持っているのかを把握した上で、ChatGPTにできることを解説しないと意味がない、という段階に来ているでしょう。
ChatGPTやその対抗馬のBardさえ追いかけていればよい、という時代はわずか数ヶ月でもう完全に過去の話になっており、専門家でそういう認識の人は一人もいないというのが現実です。
【まとめ】生成AIのオープンソース化はとっても「健全」なことだ
生成AIを勉強する立場の側では、いっぱい勉強することが激増して大変なわけですが、これはとっても良いこと、もっと明確な言葉で言えば、健全なことだと、みこちゃんは思います。
第1回の【ChatGPTの歴史】のこの言葉をぜひ想起していただけたらと思います。
人間の手をどこまで、どのような基準で加えるか、というのが生成AIと付き合っていく上で、私たち全員(もちろん研究者以外)にとってもとても大事なのです!追加学習次第で生成AIは洗脳装置にもなる。例えばC国は教師あり学習として、天安門事件はなかったことにするはずですよね。
もし私たち一般人が、ChatGPTの歴史なんてどうでもいい、というのなら、今後、歴史の改ざんなんてやり放題です。
もし世の中に生成AIがOpenAIのChatGPTしかないとしたら、それは、ChatGPTの独裁国家が一つのものの考え方を独占できるという、完全検閲の状態になります。そういうことをOpenAIのサムアルトマンさん自身が懸念しているので、実際にはそういうことにはなりませんが。
ただ、サムアルトマンが良い人であることは、生成AIの独占を許して良いことにはなりません。それ以上に、私達は私たちがいったいどんな「正解」、生成AIの作り出すアウトプットが望ましい「正解」なのか、を常に取捨選択したり、自分で作り出したりすることがとても大切です。
それは、個々人の価値感を尊重するという意味で最も大切であり、また、新しい望ましい価値観を共同で作り上げていく上でもさらに大切な態度だと思われます。
生成AIは、段々と技術だけの問題ではなく、その存り方、在るべき姿が問われる時代になっていくでしょう。
いえ、正解の百花繚乱である生成AIのオープンソース化の波は、もうそういう時代がすでに来た、ということを示しているのだと思います。
より詳しい検証記事もあります!