![見出し画像](https://assets.st-note.com/production/uploads/images/172371124/rectangle_large_type_2_7f1126103110fea122208a164d819f22.png?width=1200)
ゲンロンカフェで2025年のAIについて喋ってきた。あとDeepSeekと5090について
久しぶりに呼んでもらったので2025年のITはどうなるか、グルコースの安達社長と東京大学文学部教授でグルコース共同創業者の大向さんと三人で話をしてきた。何気に、全員が天才プログラマー/スーパークリエイターの称号を持つ未踏出身者だ。
ちなみに「未踏出身者」の中でも僕らの代は「天才プログラマー/スーパークリエイター」の称号を持っている人はその中の1/10くらいである。もうこの称号も変質してしまったが。まあ正直「天才プログラマー」という称号は恥ずかしくて称号というより十字架みたいなものだから、「スーパークリエイター」くらいデグレした恥ずかしさの称号のほうがまだ使い勝手があると思う。
僕が未踏に応募するきっかけになったのもこの二人なので、油断するといつもの与太話になりそうなところを踏みとどまることを前半は特に意識しつつ、そもそも大向教授が専門としてきた本流の人工知能研究と、俺みたいに直感と嗅覚だけでやってきた深層学習の交わり方から、かつての記号論的人工知能研究者が夢見たこと、そしてそれが今、深層学習によって根底から塗り替えられようとしているところなどを語った。
期間限定でアーカイブチケットもあるよ。
大向さんの話は網羅的でとても面白かったし、安達の素朴な現場感覚は僕にとってはもはや懐かしかった。
FizzBuzzを書けないようなレベルのエンジニアが派遣会社から月額80万円で派遣されてきて、それを使うんだったらCopilotだけでいいのではという話とか。
実際問題、月額100万円のエンジニアよりもReplit Agentのほうが役立つ場面が多い。今後、高単価な人間のエンジニアの大半は、AIですら苦手とするであろうレガシーシステムの保守みたいな、「エッセンシャルワーカー」へ移行していくだろう。
当然、DeepSeekはどういうものなのかという話もした。それどころか壇上に持ち込んだMacBookProの上でローカルでDeepSeek-R1の量子化モデルを動かしたりもした。今やなんでもアリなのだ。
![](https://assets.st-note.com/img/1738274744-DVN3LfazGn8yKRkgext4XJUY.png?width=1200)
GPUはおそらく中長期的にその役割を終え、より合目的的な半導体または光格子のようなものへ移行していく。もはやほとんどの計算が整数の積和演算で済むという発見が、実はDeepSeek-R1そのものではなく、それを応用した別のヒーローの手によって明らかになった。1.58ビットへの完全な量子化ではなく、動的かつ部分的な量子化を経由することによって、その巨大なモデルの88%に相当する部分を劇的に圧縮し、計算量を激減させることができた。
ほんの一ヶ月ほど前までは、GPT-4並の速度と精度で推論をするコンピュータを作るには、最低でも5000万円くらい必要だった。今は500万円程度の機材で実現できることになる。
秋葉原では5090の販売をめぐり大変なことになっている。
実際、僕も見に行ったのだが、大変なことになっていた。
怪我人が出たり、幼稚園の柵を越えたやつがいたらしいが、そこに集まった人はほとんど日本語を喋る人はいなかった。
中国には5090のような高度な半導体の輸出規制がかかる可能性が高く、たとえそれが60万円しようと転売すれば倍以上の値段になることすら考えられる。だからどこからか噂を聞きつけた外国在住の人たち、日本語を話すことすらできない人たちが退去して押し寄せ、怪我人が出るほどの騒ぎになった。
![](https://assets.st-note.com/img/1738275057-v1tXWxJ9ifkYdOHBGmE3cuVL.png?width=1200)
このせいで、相次いで秋葉原のショップは店頭販売を中止。Webによる抽選販売のみとなった。
これはパソコン工房のRTX5090待機列によって破壊された幼稚園の看板 pic.twitter.com/S2A1pAhp4W
— KIU-CHI⚙️ (@KIUCHI1) January 30, 2025
きれいな写真があったから比較に。
— 兎猫まさあき【NDP】 (@Masaaki_NDP) January 30, 2025
大分きつい pic.twitter.com/SBXcjyuYxV
RTX5090争奪戦の様子です
— dorapon (@no_zz_dorapo) January 30, 2025
顔写ってるので後で消します pic.twitter.com/7bmReYqkwH
まあ控えめに言って大混乱しているのである。
この狂騒も、そう長くは続かないだろう。
そもそも5090は、ゲームにもAIにも有用すぎる。下手すると、暗号通貨にも有用だろう。でもただゲームのための製品だったらここまでの混乱にはならないはずだ。
この問題は、実は舞台となったパソコン工房だけの問題ではない。
そもそも、少ないタマしか出荷できない状態で発売に踏み切るNVIDIAの問題でもある。
各店舗、割り当てられたNVIDIAの5090はわずか10個。それを争奪するんだから揉めないわけがない。PS5の時に日本人は散々学んだはずじゃないのか。
実際問題、5090はお得すぎる。60万円でも安いと思えてしまうほどに。それは最新世代のチップが載っているからだ。コンシューマグレードとしては数年ぶりのアップデートになる。さらにはVRAMが32GBもある。これは新しいスタンダードになっていくだろう。しばらくの間は。
しかし、こんな混乱は容易に予想がつくので、そもそも生産量を貯めてから出荷しても十分間に合ったはずだ。それとも、予想できなかったとでも言うのだろうか。
DeepSeekとこの問題は実は鏡のように連携している。
そもそもDeepSeekが生まれたのは、アメリカの半導体輸出規制の影響を受けている。いいGPUが手に入らないから、安いGPUで工夫して学習すると言う手法が中国では急速に確立されたのだ。これは、輸出を規制すれば当然起きうることで、本来はNVIDIAのGPUに支払われるはずだったお金が、安いGPUをなんとかするソフトウェア技術開発に割り振られることになった。ソフトウェアへの投資は、どれだけ高くてもGPUへの投資よりはだいぶ割安だから、必然的にそのような技術は生まれることになる。
GPUが手に入らないから、GPUを使わなくてもいい方法が発明された。
このようなパラドックスは、この業界では何度も起きている。たとえば今のiOSやAndroid、Linux、macOSの祖先であるUNIXは、会社の片隅に捨てられたコンピュータをなんとかこっそり趣味のために動かすために作られた。貧乏から発明が生まれている。
Webサーバーは、かつて数千万円のライセンス料を必要とした。Webをホスティングするだけで、まず数千万円払わなければならないのである。だから、高性能なオープンソースのWebサーバーが開発され、あっという間に普及した。Apacheである。
データベースもまた、非常に高価な代物だった。今でも覚えているが、ドワンゴの黎明期、自社のゲームをホスティングするのに、Oracleのライセンス料が数百万円かかることを知って躊躇した。程なくしてオープンソースのMySQLに置き換えられるようになった。数百万円がゼロに。これがソフトウェアの世界で当たり前に起きることなのだ。もっと言えば、昔はCコンパイラは数万円から数十万円した。今は全部タダだ。
DeepSeekのようなものの出現は必然的であり、これが必要とされる背景は、いいGPUが買えないからだ。だから逆説的に中国の人たちが秋葉原に行列を作るのはある意味で必然的とも言えるが、そもそも同盟国から輸出規制されているものを該当する国の住人に売っていいのかという道義的な問題はある。まあ5090が輸出規制に引っ掛かるかどうかは微妙なところだが。
一方で、M5Stack LLM Moduleに使われているAX630Cチップのようなものには非常に大きな可能性がある。
低消費電力でありながら、音声認識と音声合成とLLMを同時に動かせる。
このマシンではAIとプログラムの主従関係が完全に逆転しており、プログラムはAIへのデータの入出力を媒介するに過ぎず、重要な処理は全てAIの側で行われる。ブラックボックスなのだ。
もちろんこのブラックボックスに介入することもできる。
わずか4GBのメモリに、これだけの能力の推論エンジンが載るのは本当に驚くしかない。
まだこのチップは1.58ビット量子化などを積極的にサポートしているわけではないが、いずれそういうものをサポートしたチップが登場するだろう。DeepSeek-R1は1.58ビット量子化を経ても、すでに相当賢いので、これをハードコードした半導体があれば、劇的に安くできる可能性はある。まあそれでもROMが100GBくらい必要になるが。そもそもROMでいいのかという問題もある。これはちょっとデカすぎるので、1.5BくらいのBitNetをFPGAにするくらいの実験は必要かもしれない。
いずれにせよこれは時間の問題だろう。
今のGPU争奪戦がどれだけ馬鹿馬鹿しいか説明すると、1990年代、アメリカのとあるケーブルテレビ局が「インタラクティブテレビ」の実験をしたことがあった。テレビのリモコンから、インタラクティブな3D世界にアクセスできるようになっていて、「なぜこんなことができるんだ」と驚いたものだ。まだスーパーファミコンで初のポリゴンゲームのスターフォックスが出る前である。
その種明かしは、各家庭に一台ずつ、1億円程度するグラフィックワークステーションが割り当てられていたためだった。テレビ局側にあるグラフィックワークステーションと、家庭のテレビを繋いだだけだ。そりゃ動くよ。
「こんなの採算取れるわけないだろ」と思ったが、やはり採算ラインには乗らなかったようだ。あくまで実験だと言うことだろう。
同じように、極論すると、ChatGPTを使う時、瞬間的にユーザー一人一人に数百万円のGPUが割り当てられていることになる。特に、o1などが長考している間は、ずっと超高性能なGPUが複数台稼働していることになる。その上で、唸るほどのGPUがあっても足りなくなり、サービスはしばしばダウンする。
MetaやMicrosoftが大量に購入したGPUの主な用途は推論であり、学習ではない。
これを採算に乗せるのは恐ろしく難易度が高いはずだが、OpenAIは、内部的に1.58ビットに移行することで回避できるようになるだろう。そもそも1.58ビット量子化(BitNet)はMicrosoftが発明した技術である。
明らかに、時代はローカルAIへと移っていく。言い方を変えれば、パーソナルAIだ。誰のものでもない自分だけのAIを持ち歩く時代が遠からずくるはずである。まあ今年とか。