GPT-3.5からGPT-4への移行の壁と国産AIモデルの新たな選択肢

2024年8月9日 16:06

このノートでは、GPT-3.5の引退でGPT-4 Omni Miniへの移行を断念してしまう企業の悲劇について検証していきたいです。

GPT-3.5の代わりに登場したGPT-4 Omni Mini

OpenAIは7月にGPT-4 Omni MiniというGPT-4oより約30倍も安く、そして最大出力トークン数は16383トークン低価格のモデルを発表しました。このモデルの詳細は下記のNoteをご覧ください。

それは信じられないほど良い価格でのモデルで、
GPT -4o mini: 100万入力トークンあたり15セント、100万出力トークンあたり60セント
GPT-4o: 100万入力トークンあたり500セント、100万出力トークンあたり1500セント
Claude 3.5 Sonnet 100万入力トークンあたり300セント、100万出力トークンあたり1500セント
とのことです。

ChatGPTの日本リージョン版のでスムーズな移行ができなかった事象を検証

GPT-3.5からGPT-4 Omni Miniへの移行断念という記事

このモデルが登場することにより、GPT-3.5は引退してしまいそのことにより導入していた企業の移行断念がニュースになっていました。この様に性能が格段に上がりしかも格段に安価になったにも関わらずなぜ、断念に至ったのか検証していきたいと思います。

当初日本リージョン版のGPT-3.5-turboサービス終了時が2024年8月1日、そして新しいモデルのGPT-4 o Miniのサービス開示日11月とされたため、使用を断念する企業が続出しました。

OpenAI日本法人がとった対策

以下に、6月時点からの変更点とその影響についてまとめますと、

GPT-3.5の終了日変更:
- GPT-3.5-turbo（0613）の終了日が2024年8月1日から2024年10月1日に変更。
- GPT-3.5-turbo-16k（0613）の終了日も同様に2024年8月1日から2024年10月1日に変更。
GPT-4のアップグレード:
- GPT-4（vision-preview）が2024年11月15日以降に更新される予定。
グローバル標準デプロイへの移行:
- GPT-3.5の利用を制限し、GPT-4oを基本的に利用する方針に変更。

これらの変更は、6月時点で問題が発覚した後の対応策として導入されました。しかし、この間にプロビジョニング済みデプロイを断念した企業は多く見られました。

引き継ぎ可能なタイムスケジュールになっても課題は残る

「GPT-4o mini」はGPT-3.5よりも安価で高性能とされていますが、具体的な理由でそれが採用されなかったり、予算に合わなかったりする理由は以下のような要因が考えられます：

プロビジョニングのコスト:
- 「プロビジョニング済みデプロイ」とは、特定のカスタム設定やリソースを前もって確保するためのデプロイメント方式を指します。この方式は、高性能である反面、初期コストが高くなることがあります。
- 企業が予算内で運用するためには、この高コストのプロビジョニングが障害となる可能性があります。
移行と運用コスト:
- 新しいモデルへの移行には、システムの変更や新しいトレーニング、サポートの導入など追加の運用コストがかかることがあります。これらのコストが予算に見合わない場合、企業は移行を断念することがあります。
予算制約と優先順位:
- 企業は限られた予算内で最も重要なニーズを満たす必要があります。特に予算が厳しい場合、最もコスト効果の高いオプションを選ぶことが優先されます。
- GPT-4o mini自体は安価で高性能であっても、全体のプロビジョニングや導入コストが予算を超える場合、その利用が困難となることがあります。
技術的および運用上の準備不足:
- 新しいモデルに対応するための技術的な準備やスタッフのトレーニングが不十分な場合、移行がスムーズに行われず、追加の時間とリソースが必要となることがあります。
- これにより、短期的には予算内で運用することが難しくなる場合があります。

ChatGPT導入の日本の現状

現在のところ、OpenAIの日本市場でのシェア拡大は限定的な成果にとどまっているようです。東京オフィスの設立と日本語に特化したGPT-4カスタムモデルの提供により、一定の進展は見られますが、大規模なシェア拡大には至っていない状況です。

具体的には、OpenAIは日本市場向けに最適化されたモデルを提供し、ローカル企業との連携を強化していますが、日本国内での導入サポートや運用コストの問題が依然として課題となっています。また、Azure上での提供モデルの変更や高コストのプロビジョニング済みデプロイの導入が難しいことから、多くの企業が導入を断念している状況です。

一方で、ソフトバンクなどの日本のIT企業は生成AIの導入支援サービスを提供しており、これを活用することで導入のハードルを下げることが可能です。OpenAIの日本法人が提供するサポートも重要ですが、他の企業との連携を強化し、より多くの企業がスムーズに移行できるような体制を整えることが求められます。

AIに限らずSaaSに見られるJTC（伝統的日本企業）の課題

伝統的な日本企業（JTC）では、ITリソースが限られていることが多く、特に高度な技術的変更や移行には大きな課題があります。以下に、現状の課題と可能な解決策をまとめます：

技術リソースの不足:
- 多くのJTCでは、ネットワークエンジニアや基本的なITサポートを提供するスタッフがいるものの、高度なプログラミングやシステム移行に対応できる人材が不足しています。
外部依存:
- SaSS（Software as a Service）を利用する場合でも、外部のベンダーやパッケージに依存していることが多いです。これにより、導入したパッケージのアップデートやサポートが終了すると、システムが使えなくなるリスクが生じます。
内部の技術的知識の限界:
- 総務や経理のスタッフがVBAマクロなどを使える程度であり、AIモデルのAPIの変更や大規模なシステム移行は困難です。

スムーズなChatGPTの導入に利用できるサービス

日本のIT企業やソフトバンクなどが提供するChatGPT導入サービスを活用し、GPT-3.5からGPT-4へのスムーズな移行が可能です。

ソフトバンクの生成AIパッケージ：
- ソフトバンクは「生成AIパッケージ」を提供しており、GPT-4やDALL-E 3などの高性能モデルに対応しています。
- Microsoft Teamsとの連携やインターネット検索プラグインなどの機能が追加され、企業のニーズに応じた柔軟な対応が可能です。
他のIT企業のサポート：
- 日本の他のIT企業もChatGPT導入支援サービスを提供している可能性があります。これらのサービスを利用することで、技術的な課題を克服し、効率的な移行が期待できます。
OpenAIの日本法人のサポート：
- OpenAIの日本法人も、技術サポートやローカライズを進めています。これにより、より迅速かつ効果的な導入が期待できます。

新しい選択肢としての日本語性能GPT−４超えの国産LLM

株式会社Preferred Networksは、子会社の株式会社Preferred Elements）が開発する大規模言語モデルPLaMo™のβ版の無料トライアルの申込受付を開始しました。このモデルは、日本語においてGPT-4の性能を超えるベンチマークを叩き出しています。下記のサイトから無料トライアルの申込ができます。

以下に、PLaMoに乗り換える際のポイントと考慮すべき点をまとめます：

乗り換えのメリット

高い日本語性能:
- PLaMoは、日本語性能を評価するベンチマークテストで国内外の主要なLLMを超える結果を示しています。
- 日本市場に特化しているため、より自然で正確な日本語応答が期待できます。
トライアルの利用:
- 無料トライアル期間中にAPIを利用して、実際の性能を確認できるため、導入前にしっかりと評価することができます。
ローカルサポート:
- 日本の企業が開発・提供しているため、サポート体制や技術支援が充実している可能性があります。

乗り換えの課題

技術的な移行:
- 現在利用しているGPTモデルからPLaMoへの移行には、APIの変更やシステムの再設定が必要です。
- エンジニアリングリソースが必要となるため、移行計画をしっかりと立てることが重要です。
コスト:
- トライアル期間は無料ですが、商用版のコストについても考慮する必要があります。
- 予算に応じたコスト効果を評価することが必要です。
学習データの再トレーニング:
- 既存のシステムが特定のデータやプロンプトに最適化されている場合、PLaMoに対して同様の最適化が必要となることがあります。