生成AIの進化への企業対応とチェックリスト

2024年9月9日 08:13

生成AIの精度の向上とコストの低下が企業に迫る生成AI関連のシステムの見直しについてお話しします。

生成AIの進化

OpenAIのGPT-4シリーズ以外にもAnthropicのClaude, MetaのLlama、XaiのGrokなど大規模言語モデルの進化には事欠きません。画像や音声や動画の基盤モデルまでいれれば枚挙にいとまがありません。
今回は企業利用の中核になっているテキストの大規模言語モデルに絞ってお話しします。

OpenAIがGPT-4を発表したのが2024年3月です。その後、ずっとGPT-4というネーミングが続いています。しかし、その内容は、GPT-4, GPT-4 Turbo、GPT-4o、GPT-4o miniとすでに4世代になっています。

企業利用のメンバシップクラスの変化（有料、Enterprise、Team）やGPTs を除いても、次の変化が起こっています。

精度の変化
APIコストの変化
コンテクストウィンドウサイズの変化

精度は改善を続けていますが、今回はAPIコストとコンテクストウィンドウサイズについて変化を見てみます。

APIコストとコンテクストウィンドウサイズ

GPT-4系のAPIコストの変化

GPT-4関連のAPIコストを調べてみました。幸いなことにOpenAIはAPIコストは変更しないポリシーのようです。新しいモデルが出るたびにコストダウンはしますが、古いモデルをそのまま使っているユーザは放置するようです。
以下は、いずれも1Mトークンあたりの米ドルの価格です。左が入力トークンあたり、右が出力トークンあたりのコストです。

1年半の間にコストは200分の1になりました。GPT-4oは2024年5月、GPT-4o miniは2024年7月発表ですから、矢継ぎ早のコストダウンです。

コンテクストウィンドウサイズの変化

コンテクストサイズは2023年11月のGPT-4 Turboから128Kになりました。

最近は大きな変化はありませんが、Google Gemini 1.5 Proが1M、MagicのLTM-2-miniが100Mなので、OpenAIもどこかでは追従してくると思われます。
コンテクストウィンドウサイズが大幅にかわると企業内で利用する場合、RAG (Retireval Augmented Generation)に使うチャンクサイズの設計に影響します。

環境の変化

ChatGPT

従来、ChatGPTの無料ユーザはGPT-3.5に制限されていましたが、2024年5月からGPT-4oを使えるようになりました。

GPTs

従来、無料ユーザはGPTsの利用ができませんでしたが、2024年5月からGPTsを使えるようになりました。作るのには有料版が必要です。
GPTsは500MBのファイルを20個まで読み込めるので、理論的には10GBまでデータを読み込めます。

企業の判断ポイント

過去1年間の企業の判断ポイントは以下のとおりです：

2023年3月 GPT-4 APIのリリース　GPT-4 APIで自社カスタムシステムを作成すべきかどうか
2023年11月 GPT-4 Turboのリリース　(1) 自社カスタムシステムとしてのGPTsの適用の可否、(2) 自社カスタムシステムのGPT-4 Turbo 128Kコンテクストウィンドウに基づくRAGのサイズ設定変更の可否、(3) コスト変化による利用戦略の変更の可否
2024年5月　GPT-4oリリース (1) GPTsの無料ユーザへの開放の影響、(2) コスト変化による利用戦略の変更の可否
2024年7月　GPT-4o miniリリースコスト変化による利用戦略の変更の可否

特にGPT-4o miniは入力で33分の1、出力で25分の1という大幅なコストダウンが発表されました。1個1個のAPIコストが小さくなれば精度を上げるための戦略にも影響します。
最近は半年単位で設計方針の見直しが必要になっています。

チェックリスト

以下は簡単なチェックリストです。

自社のRAGのチャンクサイズは最新のモデルのコンテクストウィンドウを反映しているか
APIコスト変化に基づき、開発方針を見直しているか
GPT-4oの無料ユーザへの開放は自社の生成AI利用方針と整合しているか
無料ユーザへのGPTs開放は自社の生成AI利用方針と整合しているか
APIコスト変化のたびに利用コストの変化を確認しているか
新モデルリリースの時のモデル切り替え判断基準は明確か
新モデルリリース時の旧モデル復旧手順は明確か
モデル変更時に変更判断の評価をしているか

むすび

他にもファインチューニングできるモデルの変化、画像生成の変化、音声APIの変化、などがあります。
マルチモーダル系、ファインチューニング系は企業内の最新利用動向に疎いので割愛しました。
ChatGPT無料版で使えるモデルが増えても、次のバージョンアップでさらに高度なモデルが有料版に追加されるかもしれないので、全社的な利用となると朝令暮改にするわけにもいかないので判断は難しいです。
2024年11月のOpenAI DevDayも近づいてきました。OpenAIそしてそれを追撃するGoogle, Meta, Xai, Anthoropicの今後の発表が楽しみです。

参考文献

[OpenAI] pricing https://openai.com/api/pricing/