見出し画像

Amazon Echoと日本語の相性は悪い?

Amazon Echo、Google Homeの日本発売から4ヶ月が経ちました。みなさんのお宅ではまだ置物になっていませんでしょうか?
話しかければ応えてくれる、教えてくれるスピーカー。しかし人間相手に話すのとはもちろん違う。なぜならこれは会話ではなく操作であるからです。

どのように話しかける世界になるのでしょうか。
Amazon、Googleの希望はCMでも流れてるように「OK Google, タイマーを3分にセットして」「Alexa, 音楽をかけて」といった形を想定しています。OKやHeyという接頭語ももちろんそうですが、日本語の会話としてはどこか不自然に感じます。これは婉曲表現なしの命令形で話す機会が少なく、慣れてないからです。

加えて、技術的な面でもそもそも日本語会話とスマートスピーカーの相性は良いとは言えません。
日本語は、一番重要である動詞が最後に来ます。そのため最後まで聞かないと伝えたいことがわかりません。英語の場合、動詞が最初の方に来てそのあとに目的語が来ます。ソフトウェアのコードは、基本的にすること(コマンド)の後に目的や対象(引数)の配置になっており、処理もその順番で進みます。
つまり日本語を処理するためには、発言の最後から処理しないといけないため順序の逆転が起こり、他言語に比べ反応に時間がかかる・正しいコマンドを実行できない可能性が高くなってしまいます。
つまり、日本語は最後まで聞かないと何をしたいか(機能要望)がわからないため音声コマンドに向かないのです。

では日本語とスマートスピーカー、音声コマンドはどうなっていくのでしょうか。もちろん日本語の自然言語処理技術はもちろん進んでいるので、研究が進めば進むほど、語順による問題はクリアされていくでしょう。
ただその前に。日本語を話す側がスピーカーが認識しやすいように音声コマンドに合わせて話すようになる時の方が早く来ると考えます。

これはSiriでも起きている現象で、目覚ましをセットする時、「7時に起こして」でなく「目覚まし 7時」と言うようにコマンド→引数の順で話す人が多い(目覚ましぐらいなら前者でも問題なく認識しますが)

これは音声に限った特別な話ではありません。Web検索も同様でした。私たちはある単語について知りたい時に「◯◯とは」と検索窓に入力します。単語のみの検索では、その単語が出てくる記事や商品が多く出てしまうことを、幾たびの検索行動を経て知っているからです。「とは」意味を知りたい時につけるようになった、Googleに慣れ親しんだために使うようになったWeb検索特有の意味を持つ単語と言えるでしょう。

同様のことがスマートスピーカーで起こるのは想像に難しく有りません。
ただし、極端にコマンド型な日本語になるということではなく、自然言語処理の進歩と合わせて"日本語会話として不自然でない範囲で機械的処理がしやすい"話し方になるでしょう。

具体的には下記変化が起きていきます。
・修飾/被修飾の関係が入り組まないシンプルな語順になる
・目的を端的に話すようになる
・だらだらと話さない
・論理的な構成になる

「ロジカルで相手に伝わりやすい言葉で話しましょう」という社会人なりたての頃に指導されるような指摘に近いですね。
この変化は音声以外の分野で機械と接する場合も同様です。例えばGoogle翻訳も論理的にわかりやすい文章であれば現状でも精度高く翻訳でき、ユーザーにとっての便益は大きくなります。言葉は機械にすり寄っていくことを避けられません。

どんどん人の会話は論理的になっていくかもしれないですね。

この記事が気に入ったらサポートをしてみませんか?