見出し画像

生成AIサービス「神威」について、素人なりにコンセプトを読み解いてみる

神威とは何か?

この記事を読まれているひとは、すでに「神威」をお使いの人か、「気になるけど勇気のいる値段だな…」と思っているかのどちらかではあると思いますが、神威について簡単に説明します。
神威は、「AIオーケストレーションサービス」です。平たく言うと、「たくさんのAIに、一気に指示できるサービス」ということになります。
2025年1月現在、神威は、「要件定義(やりたいこと)」から、「大規模システム(の大枠)」「画像」「動画」「3Dモデル」が、一気にいくつも生成できるサービスになっています。

世間の「逆」を行く神威

「2025年はAIエージェントが熱い!」と言われています。AIエージェントの定義は人によって違いそうですが、「できるだけ人手によらず、成果物を出力してくれるサービス」のことだと、ここでは定義します。

神威は、この「逆」を志向しています。どういうことでしょう?

今、世に出ているAIサービス(の多く)は、「ある成果物を、いかに良い質て出力するか」という方向性で開発されているように見えます。「WEBアプリ」「絵」「動画」「音楽」「ワークフロー」など、単一の種類の、「1つの成果物」を出力するために最適化されていっています。

神威は…というと、たしかに「成果物」は出力されるんですが、必ず(特別に指定しない限り)複数の成果物が出力されるようになっています。
これは、完全に狙った設計であり、神威の方向性を示すものです。

複数個の出力がでるのがそんなにすごいの?と思うかもしれません。今は、「たくさんの成果物作る手間が省けて助かるなー」程度の恩恵に感じられるかもしれません。しかし、それは本質でない、と僕は考えています。

神威のコアは何か?

神威のコアは、「並列に、タスクをAIに割り振ることができる」点にあります。これだけだと、別に大したことなさそうに聞こえるかもしれません。

「あー、上司が部下に仕事ふるようなもんね。ふんふん」くらいに受け止められるかもしれません。

が、これは実はかなりすごいことをやってます。

なぜなら、この種の問題は、すぐに「組み合わせ爆発」を起こすからです。どういうことでしょうか?

たとえば、「2種のAIモデルに、3種類のタスクを割り振る」ことを考えてみましょう。これ、全部で何通りあると思いますか?

AIモデルAとBに、タスク①〜③を割り付けるのです。簡単そうですよね?

全組み合わせを考えると、「全部、モデルAがやる」から、「①②はA,③はB」…「全部、モデルBがやる」まであります。

これ、組み合わせは2の「3乗」、8種類あります。

そう。乗数です。

ということは…モデルやタスクの種類が増えると、指数関数的に組み合わせが増えるということです。

なお、モデル5つに対して10のタスクを割り付ける場合、組み合わせは9,765,625通りあります(5の10乗)。

これ、どうやって「最適な割り振り」にすると思いますか?

こういった問題を、最適化問題と呼びますが、ここで、元木さんの専門分野、量子が絡んできます。

量子は、ものすごく小さなスケールでは、実は物質は「観測されない限り、ある2つの状態を同時に取れる(量子もつれ)」という性質があります。このあたり、人間の想像力を完全に超えているので、雰囲気だけでオッケーです。直感的にピンとこないが、数学と実験結果がなぜかあってる、というのが量子の世界なので。

で、この量子を使うと、通常コンピュータは0か1かのどちらかの並びである、ある決まった数しか出力できません。しかし、量子を利用すると「0と1が混ざりあった状態」を作れるので、仮想的にものすごくたくさん並列に計算した結果が得られるのでは、と考えられています。

今のPCの弱点は「ある決まった値しか一度に出力できない」ことですが、並列にある決まった桁の計算結果が1周期で出力されるなら、それは従来のコンピュータの、(桁数)倍の計算力がある、ということになります。
書いてても意味が分かりませんが、世界の裏側である量子は、人間には直感的に分かりません。そんなもんなんだな、と思ってください。僕もよくわかってません。

で、元木さんの専門は、(たぶん)「量子をたくさん使ったときの応用を考えようぜ!」です。古典物理の限界を超えた超並列計算が専門分野です。

さてこの超並列計算、なにが嬉しいのかというと、先程の「組み合わせ爆発」にものすごく強いです。なぜなら、「爆発した組み合わせを、並列に全部計算できるから」です。

実際には、当然量子コンピュータはまだ実用化されていないので、擬似量子化だそうですが、「ものすごくたくさんの割り振りの組み合わせから、良さそうなものを推定する」ことが、神威のコア部分だと考えます。どんな出力ができるか自体は、この「超並列プロセス」に比べれば、神威独自のものではありません。それよりも、「たくさんのAIモデルを、1つの目的に向かって、実現可能な時間で(というかめちゃくちゃ早く)並列させる」ことが、神威のコア機能です。

アップデートから見る神威の方向性

さて、今後神威はどうなっていくのでしょうか。
僕が神威を知ったのは2024年末。当時は、第三世代神威がアルファ版でした。

完全に「大規模システムを生成するためのシステムなんだろう、今後は細かいところまで詰めたソースが出力されるのかな、なんて思っていました。

が、みなさんもご存知の通り、今現在はそうではなく、なんと「画像」「映像」「音楽」「動画」も、ナマの生成AIモデルが生成できるものすべてを出力せんとするばかりです。

なぜこのような方向転換がおこったのか?よりニッチな方向にプロジェクトをシフトしたのか?

そうではない、と僕は思っています。

なぜなら、おそらく神威のスコープは、「コンピュータで出力できるものすべて」だと考えるからです。

生成AI,特にマルチモーダルと呼ばれるモデルは、テキストだけでなく、絵や音声も扱うことができます。理論上、デジタル化されていればなんでも扱えるはずです。

コンピュータ上では、究極的にはデータはすべて0と1に変換されています。AIモデルからみても同じです。すなわち、どんな種類のデータも、PCからみると「ベクトル(さまざなパラメータがズラッと並んだ列)」になります。

さて、神威のスコープはなんだったか?

神威のコアは、超並列計算によるスケジューリングだと記載しました。同様に、成果物にしても「超並列で行った0/1の塊」だと考えられているのではないでしょうか。つまり、文書も動画も、コンピュータからみるとただの0/1なのです。決められた手順で復元すると、映像だったり音楽だったりするわけです。

将来的には、PCで出力できるものはなんでも、神威で作れるようにしたい、と考えているのでは?と思っています。

進化論的自然言語プログラム

このあたりから妄想全開になります。現在の神威は、「まずプロンプトを与え、それをタスクに分解してAIモデルに割り付け、ファイル生成」を行っていますが、これは今後どうなっていくでしょう?

僕が考えている1つの方向性は、「繰り返しと条件分岐が追加され、延々にAIによる計算結果が、並列に改善され続ける」何かになるのではないか、と考えています。

現在の神威には、自分で作った成果物をもとに、さらに詳細化するようなことは(たしか)できません。同様に、「こういう判定条件のときは処理A,そうでないときは処理Bをやっといて」とかも無理です。

が、これが揃うとどうなるか。

一気に通常のプログラムに近くなります。細かい実装はたくさんありますが、ざっくりと言えば、コンピュータは繰り返しと条件分岐で、強力な計算能力を得ていると考えます。

つまり、神威内で、繰り返しによるフィードバックループに入り、改善され続ける情報が、あたかも進化により生き残り続ける生物たちのように出現するのでは…と考えています。もうこうなると神威が「何」と呼ばれるか、僕には想像できません。

神威の可能性

この記事を読んでいるみなさんも、直感的に「これは他のプロジェクトとは違うぞ」と感じられたのではないでしょうか。
変化の早すぎるAI業界なので、明日Googleあたりからいきなり競合が現れてもおかしくないと思っているのですが、この方向性で走っているプロジェクトは、神威以外には見かけません。

神威は、「多数のAIを指揮できるシステム」として設計されており、個人が何千、何万人分の成果をあげられるのさような、可能性のあるプロジェクトだと感じています。

これからどのような世界を見せてくれるのでしょうか。リアルタイムでその進化を目の当たりにできて、本当にラッキーです。みなさんといっしょに、特等席で見届けたいと考えています。

ここから先は

0字

¥ 300

この記事が気に入ったらチップで応援してみませんか?