見出し画像

オライリーの Designing Voice User Interfaces を読んでいる(1章後半)

前回は第1章の前半についてまとめたので、今回は後半についてまとめる。

後半はAmazon Echoと人間の会話を例に、「会話」を成り立たせるために必要な要素について説明している。長いので全ては載せないが、例は以下のとおり。

人間 「Alexa How are you doing?」
Alexa 「I'm good.」

人間「What's your favorite color?」
Alexa 「I like sea foam」

人間 「What do you do for fun?」
Alexa 「I don't have any hobbiies」

一見会話になっていそうだが、いずれも一回こっきりのやりとりでしかない。互いにコンテキストを共有しながら複数回のやりとりをする「会話」とは言い難い。

まだ巷の音声アシスタントの使われ方は照明のオンオフや音楽の再生など、単純なコマンドを受け取るようなタスクがメインで、人間と「会話」はしていないと言われている。

これを次のレベルに押し上げるためには「過去を思い出せること」が重要となる。具体的には以下の2つである。

- 昨日注文したもの、しばしばリクエストする楽曲などの過去の会話

- 会話中に人間がアシスタントとの会話で言ったこと。定番な例だと

人間 「日本一高い山は?」
Alexa 「富士山です」
人間 「”それ”は何メートル?」
Alexa 「3776メートルです」

みたいに、「それ」を覚えておくことで自然な会話を演出できる。

次に、VUIデザイナーとはいったい何なのかについて語られている。

VUIデザイナーは会話の最初から終わりまでの全体をデザインする。

また、会話を通してユーザーがタスクを完了するにあたって何を課題に感じているのかを研究し、考える必要がある。

どう考えるかというと、ユーザーとアシスタントの対話を実際に紙に書き起こして考えてみる。

自分は紙に書かずにベクターツールに書き起こすが、書き出すだけでなく、書いたら一度それを読み上げてみることも大事だと思う。

書いている時は意外と気づかないが、読み上げてみると意外と文字数に無理があったり、不快感のある言い回しだったりすることがあるからだ。

Alexa開発ドキュメントでは、アシスタントの発話は一息で読み上げられるくらいの長さが良いとされている。5〜7語くらい。

次は第2章

いいなと思ったら応援しよう!