30万円で最高性能の国産LLMを開発!〜企業独自LLMが当たり前の時代を目指して〜
こんにちは、小田志門です。今日は、驚くべき低コストで高性能な国産大規模言語モデル(LLM)を開発した私たちの取り組みについてお話しします。企業独自のLLMが当たり前の時代に向けて、どのように進んでいるのか、一緒に見ていきましょう。
ざっくり概要
私たちカラクリ株式会社は、カスタマーサポートDXを推進している企業で、世界初となるAWS Trainiumを用いたMoE(Mixture of Experts)モデルの学習に成功しました。この「KARAKURI LM8x7B Chat v0.1」をわずか30万円・12時間で構築し、国内最高水準の性能を実現しました。
当社のLLMの特徴は以下の3つです。
エヌビディア社のGPU不足解消に貢献
従来、生成AIによる学習にはNVIDIAのGPUが多く使われていましたが、これに代わる選択肢を提供します。AWS TrainiumでのMoEモデルの学習成功
この技術により、企業は自社に最適化されたLLMを低コスト・短期間で構築できるようになります。わずか30万円で国内最高水準の性能実現
これにより、企業が自社で生成AIモデルを持つことが現実味を帯びてきました。
(1)NVIDIA以外の選択肢
生成AI市場ではNVIDIAが圧倒的なシェアを持っていますが、GPUの供給不足が続いています。これに対抗するため、AWSのチップを活用した取り組みが増えており、これが業界全体に良い影響をもたらすと考えています。私たちはこの新たな選択肢を模索し、企業の生成AI活用を促進したいと考えています。
上記のサイトには約92%のシェアを誇っていると記載されています。
NVIDIAの決算も絶好調のようです。
NVIDIAが絶好調なのであれば、GPUもたくさん流通しているのでは?と思われるかも知れませんが、めちゃくちゃ不足しているのが現状です。
これだけ凄まじい決算でも、まだGPUが不足している状況ってどんなレベル?と思いますが、、、。
ということで、NVIDIA以外の選択肢を持って、生成AIを動かせること、はAI界隈とっては密かに注目ポイントかなと思っております。
そんなNVDIAのGPUが花盛りな今、AWSさんのチップで開発実績を出し続けることも、業界全体にいい影響となればいいな、という思いであります。
(2)学習コスト30万円の意味
生成AI・大規模言語モデルは、通常、高額なコストがかかります。しかし、私たちの取り組みで学習コストが30万円に抑えられたことは、企業にとって「自社が生成AIモデルを持つ」ことのハードルを大幅に下げる要素です。これにより、以下のようなニーズに応えることが可能になります。
自社システムに適した生成AI活用
自社のドメイン知識をLLMに学習させ、専門性の高い業務支援
機密データを外部に出すことなく、セキュアな環境でLLMを活用 -低コスト・短期間でのLLM開発と迅速なPoC(概念実証)
一言でいうと、「セキュリティを気にせず、安心して活用したい」というニーズに応えます。
(3)RAGとフローエンジニアリング
企業活動におけるLLM活用では、RAG(Retrieval-Augmented Generation)やフローエンジニアリングが重要な要素となります。特に、自社のデータの機密性が高い場合には、自社LLMのニーズが高まります。また、フローエンジニアリングを活用することで、自社のビジネスプロセスに特化した統合的な対応が可能となります。
例えば、コールセンターで生成AIを活用する際、音声データを外部APIに送信することがセキュリティ上のリスクになることがありますが、自社LLMならその問題を解決できるでしょう。
まとめ
さらに、独自のモデルを企業で持つ際には、新たな技術に適応するコストが高いのではという疑問もありますが、今回の学習コスト30万円は、一定の実現性を示しています。このモデルはオープンソースとしても公開しており、比較的自由に活用することができます。
企業独自のLLM開発を検討されている企業や開発会社の方々、ぜひお問い合わせください。一緒に新しい時代の生成AIを実現していきましょう!
技術解説もこちらにありますので、ぜひ。