ChatGPTの音声対話機能、その課題と未来
お疲れ様です。
日々、ChatGPTをはじめとするさまざまなLLMとの対話を続けています。
先日、AI関連の交流会に参加した際に、ChatGPTの「リアルタイム音声対話機能(Advanced Voice mode)」について話題が出ました。
その場で「実際に使ったことがない」という声があったため、交流会会場でリアルタイム音声対話機能をデモしてみることにしました。ところが、「こんにちは」や「いい天気ですね」といった簡単な呼びかけをしても、反応がありませんでした。
おそらく、会場がざわついており、周囲の雑音が多かったため、私の声を正しく拾えなかったのだと思います。
現在、この機能を試す方の多くは、静かな自宅などで利用しているため大きな問題は生じにくいと思います。
しかし、今後リアルタイム音声対話機能が普及し、日常生活のあらゆる場面で使用されるようになれば、人混みの中でも使いたいといったニーズが生まれる可能性があります。
たとえば、博物館などの公共空間で、個人に合わせてAIが展示物の解説を行うような場面も想定できます。そのように周囲が騒がしい環境でも、利用者一人ひとりと円滑に対話できるリアルタイム音声対話機能が求められてくるかもしれません。
リアルタイム音声対話機能には、非常に大きな可能性と発展性を感じます。
今後どのように生活に浸透するか本当に楽しみですね。
最後までお読みいただき、ありがとうございました。