もう人間やん！音声対話AIモデル「J-Moshi」が怖いくらいすごい

2025年1月25日 12:55

こんにちは、くろまめ！です。

昨日SNSをみていたら、とんでもないものを発見してしまいました。
AIと対話している動画なんですけど、AIの受け答えがもうほぼ人間。
下記のXの投稿の動画を再生してみてください。

日本語リアルタイム音声対話モデルJ-Moshiを公開しました！@kyutai_labs のMoshiをベースとし、人間のように「話す🗣️」と「聞く🎧」を同時に行います。
日本語で利用可能な初めてのモデルです。
モデルサイズは7Bと軽量なのでぜひお試しください‼️#NLP2025 で発表予定です。https://t.co/t2EKifkO46 pic.twitter.com/EOBSqQER4F
— Atsumoto Ohashi (@atsumoto_ohashi) January 24, 2025

もう人間やんか...。

すごくないですか？
くろまめ！ははじめ「え、どっちが人間！？」てなりました。
ChatGPTなどでAIと会話することは以前からできてましたが、レスポンスの速さがもう比にならないくらいすごい。
むしろ速すぎて逆にちょっと気になるレベル。

1.J-Moshiって何！？

J-Moshiは、日本語で利用可能な初のフルデュプレックス（同時双方向）音声対話モデルで、名古屋大学大学院情報学研究科の研究チームがフランスのスタートアップ企業Kyutaiが開発した音声AIモデル「Moshi」を基盤に最適化したものらしいです。

ユーザーが話している最中にAIが応答や相槌を行うなど、人間にかなり近い自然な会話ができます。

2.すごいポイントをご紹介！

1. 超高速レスポンス！

なんと応答遅延はたった200msなんです！人間の反応時間と変わらないレベル...！これはすごすぎませんか？

2. 軽量設計なのに高性能

モデルサイズは7B（70億パラメータ）と軽量。
でも性能は本当にすごい！くろまめ！も動画を初めてみたとき「えっ、これAIなんか！？」って思わず声が出てしまったほど😳

3. 感情豊かな会話が可能

70種類以上の感情や話し方を表現できるみたいです。
相槌も打てるし、人間らしい会話ができちゃいます。

3.これでどんなことができるの？

オンライン会議での活用
遠隔医療やカスタマーサポート
語学学習のパートナー
チャットボットとしての活用

相槌とかも打ってくれるとなると、相談相手としてもかなりいい感じになりそうじゃないですか？
特に語学学習での活用は興味深いです。リアルな日常会話の練習ができそう...！
これは世界が変わるぞ。私も早く使ってみたい！

4.まとめ

J-Moshiの登場で、AIとの会話がますます自然になりそうです。
くろまめ！としては、これからの発展がとても楽しみ！皆さんはどう思われましたか？

2025年3月の言語処理学会「NLP2025」での発表が予定されているそうなので、続報も楽しみですね！

〆

ここまで読んでいただき、ありがとうございました。

記事が参考になりましたら、ぜひスキぽちやフォローをお願いします！

それでは☺︎ノシ

#AI #JMoshi #音声対話 #テクノロジー

いいなと思ったら応援しよう！

記事が参考になるよ！おもしろい！なときに応援したってもらえると、くろまめ！が飛び上がって喜びます。いただいたチップは今後の活動費として大切に使わせていただきます‼︎😊