GPT4o発表と【CoachMET】の対応
米国時間の5月13日にOpenAIがSpring UpdateでGPT4oを発表しました。
(GPTフォーオーと発音していました。oはオムニのoとのことです。)
リアルタイムで音声(オーディオ)、画像(ビジョン)、テキストをシームレスに処理できるようになるとのことで、デモではより自然なインターバルでの会話や簡単な数式をカメラで写しそれに関しての会話などが紹介されていました。
また多言語、音声、画像処理のスピードが向上したとのことです。
そして、気になる価格ですがAPI利用で従来のGPT4Turboに対して半分に。
これはAPI(プログラムからGPT4oにアクセスする方式)でLLMを利用してるCoachMETにメリットとなります。(ChatGPTでは機能反映はしますが価格変更は無いようです。)
CoachMETではInputはクライアントが入力するテキスト(質問や会話)、OutputはCoachMETがレスポンスする際にOpenAIのLLMを利用した部分で発生する費用です。
クラウド費用や別サービス、機能も利用しているためコストが半額になる訳ではありませんがクライアントさんの使い方で一番価格変動要素が大きなOpenAIのLLM利用費用が半分になるのは朗報です。
さらに多国語(日本語含む)対応の強化で言葉がいくつのtoken数になるかの数値も改善しているとのことで例(常にこの比率の改善にはならないと思います)が示されました。
CoahMETとして日本語→tokenの効率化と単価の改定でコストメリットが大きいことから、6月のリリースでGPT4o対応をすることにします。
リアルタイム会話機能は多少ラグはありますが、現状のテキストを音声でお伝えする機能のままとし、皆さまのニーズに沿ってリアルタイムの会話機能への取り組みを検討します。
詳細は他の機能も含め別途5月末にお知らせする「6月リリースノート」でお知らせします。
今後もAIの進化と進歩は続いていくと想定しています。エボックスでは、より良いコーチングを提供していくための重要なコンポーネントとしてAIを位置づけその進歩・進化を取り入れCoachMETを進化させていきます。