子どもと音声対話システムの会話の観察をしてみた。
家では娘・息子とものづくりを中心にやっていますが、本業ではチャットボットとか対話型のシステムを使った企画やらを、ここ数年しています。
そんな本業があるからか、
子どもが音声対話システムを使っているのを観察していました。
その中で子どもと対話システムについて考えていたことを書きます。ただただ、考えていることを書いているだけですw。
音声対話と我が子の出会い
娘も息子も最初は僕のiPhoneのSiriが初めての音声対話でした。
スマホ自体は喋る前から気になって触ってたのですが、ふたりとも少しずつ会話ができるようになってから、「なんかたまに声に反応するやつがいる・・」ということに気づき、話しかけていました。
最初は、全然認識もせず、よくわからない文字の羅列になり、「よくわかりません」としか答えないSiri。
それでも、「よくわかりません」と答えてくれる。
これがよほど嬉しかったのか、ひたすらに話しかける日々が続きます。
話しかけている中で徐々に適当な文字の羅列が単語に変わっていきます。
そしてとうとう完璧な受け答えをする日が・・・
「今何時?」
「○時○○分です」
それがこちらでした。偶然なのか、最初は娘も息子も「今何時?」をSiriが認識しちゃんと回答をしました(息子の方は娘が今何時?っていうのを聞いていたから真似したということはあると思います)
意思の疎通をSiriとできたとき、子どもたちは止まりません。
ひたすらに「今何時?」を繰り返します。
まるで、「今何時?」ボットとそれに答える時報ボットです。
たったこれだけのこと・・それでも娘と息子は音声対話に夢中でした。これだけで楽しめるし、とても嬉しそうにする。
たったこれだけでなんでこんなに楽しめるのか観察しつつ、考えてみました。
対話システムにイライラする大人と楽しめる子ども
普段チャットボットや、音声対話のシステムを企画し開発・運用をしている中で、少しでも自分の想定した反応と違うと、イライラして怒っているユーザーがたくさん出てきます。
自分の想定した反応とは違うことで、「こいつは駄目なボット」という認識になり、ボットだからと攻撃をしてくるんじゃないかと思ってます。
音声認識も同じ。少しでも反応しないと「ダメ」となり、イライラしてしまっている様子。
大人は自分の言うことを聞かないとイライラしてしまう。
それが人間でなくボットなら尚更・・!
一方、子どもを観察すると、たとえ認識をしなくて「よくわかりません」だけしか答えなくても「Siriわからないって言ってるwwww」「今何時しかわからないの!www」と爆笑。
大人とは音声認識やボットへの許容が違います。
なんで子どもはこんなに音声認識を楽しめるのか。
大人は数十年生きてきていて、基本的に自分が話したことはよっぽどのことがない限り相手が理解をしてくれると思っています。
なので、ボットも理解してくれる前提で話す。結果、よくわかりませんと返ってくると、こいつ全くしゃべれないということになってしまう。
一方子どもは、そもそもまだ言葉自体が未熟なので、親に対しても意味が通じないことがある。それでも親がちゃんとコミュニケーションをしてくれると喜ぶ。お話自体が好き。何でも聞いてほしいお年頃。
だからこそ、音声認識はいつでも自分が話しかけたことに反応をしてくれるし、そもそも子ども自身も多くの言葉を理解しているわけではないので、相手が理解をしなくても大丈夫。理解されなくても話をしたら返答があることが大事。
この生きてきた時間・言葉を使ってきた時間の差がココに出てきているんじゃないかなと思っています。
子どもにとっては自分の話したことに対して反応してくれる事自体が楽しいこと。だからこそ音声対話システムとは相性がよく、音声対話システムと会話していることで、Siriと一緒に賢くなっていく気がしていました。
チャットボットはそこまで日本語を理解できない
チャットボットというと最初っから完璧に受け答えしてくれるという考えを持ってる人がいるなぁという印象です。
でも、普通に人間を考えると、教えてもらえないと喋れない。
子供の時に色々教えてもらうことで理解し話せるようになります。
チャットボットも同じで、特に日本語は難しく、最初は同じことをいろんな聞き方で言ってくるので、返答できないものもたくさんあります。
なので、運用をしていき、多くの質問を受けたものから答えられるように学習をさせていく。会話をしないとデータも集まらないので答えられないままになってしまいます。
そして、さっきも書きましたが、日本語は難しいので、開けてみると単純なキーワードのマッチングだけで反応してることがあるため、雑談みたいなことは難しかったりします。
このレベル感が大人にあっていないのでイライラしてしまう。
未就学くらいの子どもは話すこと自体が楽しいし、言語のレベル感的にはボットが丁度いいレベル(子供のほうが少し優位かなというくらい)。
こう考えると、やっぱり未就学児の子どもはチャットボット・音声システムで会話をすること自体を楽しめるレベルにあり、もし一緒に学習していくことができたら、子どもも楽しみながら言語レベルを上げ、対話システムも学習をしながら、小学1年生くらいまでの相手はできるようになる。
そういう、子どもと一緒に成長するボットができると面白いなぁと思ってます
終わりに
子どもがSiriとの「今何時?」から始まり、面白かったので観察をしていましたが、今ではLine ClovaとAmazon Echoでピカチュウと話したり電車クイズしたりして楽しんでます。もう娘はほぼ使いこなします。
まだ息子は「今何時?」期をちょっと抜けて、電車の名前やら車の名前やらを連呼する日々です。それで、はやぶさとかこまちを誤変換され、なんでわからないのぉーと爆笑。楽しそうで何よりです。
僕の子どもたちは音声インターフェースと普通に会話をして楽しんでいるけど、この子達がおとなになる頃にはもっと音声インターフェースが身の回りに増える未来になっている。音声になじんだ我が子たちはどう接していくのは引き続き観察していきます。
そして、今考えているもし子供とレベル感の同じボットが、小さな頃から一緒に言葉を覚え育っていくボット。
そんな、音声インターフェースがあると面白いなと思いつつ、
そういうのもっと前に思いついて、僕の子どもたちが話す前から与え、一緒に育ててみたかったと思う父でした。