OpenAI、開発者会議で「リアルタイムAPI」発表! AI音声対話の未来が変わる?
OpenAIが開発者会議「DevDay 2024」で、リアルタイムAPIの公開ベータ版を発表しました。
このAPIを使えば、開発者はChatGPTの高度な音声モードのように、低遅延でAIが生成した音声応答を作成できます。しかも、6種類のカスタムボイスから選択できるので、自分の好きな声優さんを選んでAIと話せるようになるのです。
これをきっかけに、AIによる音声応答を活用したアプリ開発は更に盛り上がることが予想されます。特に言語学習市場・教育市場・旅行/観光市場・エンタメ市場・ヘルスケア市場での活用が活発になるのではないでしょうか。
APIと地図や通話APIなどのツールとの統合も発表されたため、特に旅行/観光市場では積極的にリアルタイムAPIが活用される可能性が高いです。これにより、旅行の計画を立てたり、レストランの予約をしたりといった、より複雑なタスクを音声でAIに指示できるようになります。
もう複雑なプロンプトを書かなくても、優秀な人材と会話するように、あらゆる場面で気軽に、AIへ複雑なタスクをお願いする日が来るかもしれません。マーケティング業務や経理業務といった、ビジネスプロセスを丸ごと巻き取るような音声対話AIも出てくることでしょう。
加えて、OpenAIは2年間でAPIの価格を99%も削減しました。これは、MetaやGoogleといった競合との競争激化に対応するための戦略です。コストの観点からも、やはり音声対話型AIプロダクトの開発は盛り上がっていきそうです。
OpenAIのDevDay 2024は、AI開発者にとって刺激的な発表となりました。リアルタイムAPIの登場により、AI音声対話の未来は大きく変わるかもしれません。