気になる生成AI備忘録-vol.10-日本発「Sakana AI」
■気になる生成AI備忘録とは
個人的に気になる生成AIのポスト(X)をまとめた備忘録を共有する連載シリーズです。
より気になるもの・深追いしたいトピックは当サイト『はじめての生成AI比較.com』にてUP予定ではありますが、サイトは生成AIはじめての方・初心者の方向け、こちらnoteでは、基本的には脱初心者目線で取り進めています。
今回紹介するのは、Sakana AIです。
※こちらは備忘録でありつつ、「Sakana AIについて、Githubやデモを見たけど、よくわからない」といった方のための内容です。
Sakana AIとは、東京で生成AIのトップ研究者たちによって創られたAIベンチャーです。
そんなSakana AIが、2024年3月21日、生成AI開発の新たな手法を開発したことを発表しました。
Sakana AIが開発した「進化的モデルマージ」
「進化的モデルマージ」のここがすごい!
というのをわかりやすく説明すると、従来のAIモデル開発は
・人間の手作業による設計が必要
・多くの計算資源が必要
・モデルの性能が限定的
などの問題がありました。
それぞれ、より具体的にいうと、
・人間の手作業による設計が必要=膨大な時間・労力が必要
・多くの計算資源が必要=莫大なコストがかかる
・モデルの性能が限定的=人間の経験・知識に依存
といった問題です。
これらの問題を、Sakana AIが開発した「進化的モデルマージ」は解決する革新的な手法になる、とのことです。
▼「進化的モデルマージ」の特徴
・自動設計...機械学習によって自動的にモデルを設計
・少ない計算資源...従来の1/100以下の計算資源でモデル開発
・高性能なモデル...従来のモデルを上回る性能
▼「進化的モデルマージ」の仕組み
・少ない計算資源で高性能なモデルを生成
・公開されている複数の基盤モデルを組み合わせる
・進化的アルゴリズムを用いて、最適な組み合わせを見つける
そして、Sakana AIは「進化的モデルマージ」を用いて開発した日本語モデルが以下の3つ
・EvoLLM-JP...日本語で数学の問題を解けるLLM
・EvoVLM-JP...日本語の画像とテキストを理解するモデル
・EvoSDXL-JP...日本語の画像生成モデル
それぞれのモデルが、複数のベンチマークにおいて、非常に高い性能を達成したそうです。
公開されているデモは、EvoVLM-JPを試すことができるデモとなっています。(無料です)
デモでは、Examples(例)として入力画像が3枚用意されているので、すぐに試すことが可能(入力した画像に対して、質疑応答することが可能)です。
↑の画像の場合、「この信号機の点滅している色は何色ですか?」という質問に対し、Submitボタンをクリックすると、右側にあるモデルからの返答のところに「この信号機の点滅している色は青です。」と返答する例が確認できます。
画像に対する質問に正確に答える様子が確認は出来るのですが、ChatGPTやGeminiなどの生成AIでも同様のことが可能なのでは?
と、疑問を抱かれる方もいるかもしれません。
個人的には、画像理解の精度や処理速度、アクセスできる知識と情報の多さ等はSakana AIに軍配が上がるのかな、と感じました。
これは個人的に感じただけで、例えばChatGPTと比較して、という触れ込みはSakana AIから公式発表があったわけではありません。
しかしながら、Sakana AIのブログ・論文から察した推論です。
※情報等、万一間違いがあれば指摘いただければ訂正致します
ちなみに、Sakana AIのブログでは
といったことも書かれていました。
Sakana AIは、画像理解と質問応答の分野以外にも、様々な分野で大きな進歩をもたらす可能性を秘めた技術だとは思いました。
エンタメものだけでなく、科学等の研究、製造工程の自動化ないし効率化への貢献(例えば製品検査自動化、生産ラインにおける異常検知など)、教育や医療と、様々な分野で活用される可能性はあるのではないでしょうか。
今回の備忘録は、Sakana AIのAI技術/概要をごく簡単にわかりやすくまとめただけにすぎません。
気になった方は是非、まずはSakana AIのブログをじっくり読み込んでみることをおすすめします。
※2024年4月23日追記※