もう人間やん!音声対話AIモデル「J-Moshi」が怖いくらいすごい
こんにちは、くろまめ!です。
昨日SNSをみていたら、とんでもないものを発見してしまいました。
AIと対話している動画なんですけど、AIの受け答えがもうほぼ人間。
下記のXの投稿の動画を再生してみてください。
もう人間やんか...。
すごくないですか?
くろまめ!ははじめ「え、どっちが人間!?」てなりました。
ChatGPTなどでAIと会話することは以前からできてましたが、レスポンスの速さがもう比にならないくらいすごい。
むしろ速すぎて逆にちょっと気になるレベル。
1.J-Moshiって何!?
J-Moshiは、日本語で利用可能な初のフルデュプレックス(同時双方向)音声対話モデルで、名古屋大学大学院情報学研究科の研究チームがフランスのスタートアップ企業Kyutaiが開発した音声AIモデル「Moshi」を基盤に最適化したものらしいです。
ユーザーが話している最中にAIが応答や相槌を行うなど、人間にかなり近い自然な会話ができます。
2.すごいポイントをご紹介!
1. 超高速レスポンス!
なんと応答遅延はたった200msなんです!人間の反応時間と変わらないレベル...!これはすごすぎませんか?
2. 軽量設計なのに高性能
モデルサイズは7B(70億パラメータ)と軽量。
でも性能は本当にすごい!くろまめ!も動画を初めてみたとき「えっ、これAIなんか!?」って思わず声が出てしまったほど😳
3. 感情豊かな会話が可能
70種類以上の感情や話し方を表現できるみたいです。
相槌も打てるし、人間らしい会話ができちゃいます。
3.これでどんなことができるの?
オンライン会議での活用
遠隔医療やカスタマーサポート
語学学習のパートナー
チャットボットとしての活用
相槌とかも打ってくれるとなると、相談相手としてもかなりいい感じになりそうじゃないですか?
特に語学学習での活用は興味深いです。リアルな日常会話の練習ができそう...!
これは世界が変わるぞ。私も早く使ってみたい!
4.まとめ
J-Moshiの登場で、AIとの会話がますます自然になりそうです。
くろまめ!としては、これからの発展がとても楽しみ!皆さんはどう思われましたか?
2025年3月の言語処理学会「NLP2025」での発表が予定されているそうなので、続報も楽しみですね!
〆
ここまで読んでいただき、ありがとうございました。
記事が参考になりましたら、ぜひスキぽちやフォローをお願いします!
それでは☺︎ノシ