![見出し画像](https://assets.st-note.com/production/uploads/images/171723401/rectangle_large_type_2_b4f4254f49b3535faf64ddf08f284310.png?width=1200)
音声対話の便利さと盲点:ChatGPTの音声対話機能の意外な一面
お疲れ様です。
日々、ChatGPTをはじめとするLLMと対話を続けています。
私は特にChatGPTの音声対話機能をよく利用しており、この機能がないと生活に支障をきたすほど便利に感じています。
しかし、先日その音声対話機能を利用している際、ハルシネーションに遭遇しました。
「GPT-4oのコンテキストウィンドウサイズはどれくらいか?」と質問したところ、「1万6千トークン」と回答されました。
ただし、正確な値は「12万8千トークン」であり、この回答は誤りでした。
そこで「ネット検索をしたうえで、もう一度回答してほしい」と依頼しましたが、結果は変わらず「1万6千トークン」と音声で返答されました。
「あれ、正しく答えられないこともあるのか」と思い、音声対話モードを中断して会話履歴を確認したところ、そこには正しい値「12万8千トークン」と記録されていました。
音声では誤った数字を返答しつつも、テキストでは正しい値が記録されていることがあるのだと気付き、大変勉強になりました。
音声対話機能は非常に便利で欠かせない存在ですが、動作が不安定な場面やハルシネーションが起こる場合もあるため、注意が必要だと感じます。
ChatGPTの音声対話機能の特徴を理解した上で、今後も積極的に使っていきたいですね。
最後までお読みいただき、ありがとうございました。