見出し画像

音声対話の便利さと盲点:ChatGPTの音声対話機能の意外な一面

お疲れ様です。

日々、ChatGPTをはじめとするLLMと対話を続けています。

私は特にChatGPTの音声対話機能をよく利用しており、この機能がないと生活に支障をきたすほど便利に感じています。

しかし、先日その音声対話機能を利用している際、ハルシネーションに遭遇しました。

「GPT-4oのコンテキストウィンドウサイズはどれくらいか?」と質問したところ、「1万6千トークン」と回答されました。

ただし、正確な値は「12万8千トークン」であり、この回答は誤りでした。

そこで「ネット検索をしたうえで、もう一度回答してほしい」と依頼しましたが、結果は変わらず「1万6千トークン」と音声で返答されました。

「あれ、正しく答えられないこともあるのか」と思い、音声対話モードを中断して会話履歴を確認したところ、そこには正しい値「12万8千トークン」と記録されていました。

音声では誤った数字を返答しつつも、テキストでは正しい値が記録されていることがあるのだと気付き、大変勉強になりました。

音声対話機能は非常に便利で欠かせない存在ですが、動作が不安定な場面やハルシネーションが起こる場合もあるため、注意が必要だと感じます。

ChatGPTの音声対話機能の特徴を理解した上で、今後も積極的に使っていきたいですね。

最後までお読みいただき、ありがとうございました。

いいなと思ったら応援しよう!