見出し画像

音声データによるLLM

大規模言語モデルで遅れをとる日本は、国民が電話で行う会話を収集蓄積して学習データとする法案を可決した。

テキストベースのデータに比べて口語であるという特徴を活かし、より自然な会話を行えるようにしようというものである。
また、人間は文字化された確かな情報よりも、立ち話のような、つまり井戸端会議のような会話によって実は行動が左右されている実態もあるので、人間味を感じるAIの構築が期待されている。
一部でプライベートな会話が学習データに使われることへの懸念もあるが、それよりも、根拠のない噂話や痴話に強いAIになるのではないかと否定的な意見が起こっている。

この記事が気に入ったらサポートをしてみませんか?