VUI: 音声インターフェースデザインとは

2021年3月30日 12:55

(原文) VUI: The Future of Voice Interface Design Explained

皆さま、こんにちは。UXPinです:)

今回は「VUI」についてお伝えしたいと思います。それではどうぞ！

プロセッサの小型化やIoTデバイスの増加に伴い、VUIへの全体的な流れは加速しています。GAFAMはいずれも、音声インターフェースを今後の課題として多額の投資を行っています。

2019年には、オンライン検索の59％が音声によるものと推定され、一部の業界特有の検索ではさらに高い数値が計上されています（例えば、食品・レストランの検索は68％に達しています）。音声および音声インターフェースの市場分野は、2025年までに249億ドルに達する見込みです。

VUIとは

VUI(音声インターフェースデザイン)とは、音声認識を利用して、ユーザーが音声コマンドでテクノロジーを操作できるようにするものです。世界がますます速いペースで情報が氾濫する中、音声技術はGUIの優位性に挑戦しており、ユーザーはよりスムーズに操作することができます。キーボードは、ブログを書くようなテキストを多用する作業には有効ですが、検索、記事の更新、操作性の調整、道順の確認などの簡単な作業では、人々はむしろ話すことを望みます。例えば、小さな画面で住所を入力するなど、多くのステップを省くことができますが、そのためには完璧に機能しなければなりません。実際には、音声インターフェースデザインは、タップ＆スワイプ技術と連携して、より良いUXを実現します。

効果的なVUIを作るには

ユーザーがVUIに求めるものはただ一つ、自分のコマンドを間違いなく瞬時にデバイスが認識することです。人間は、バックグラウンドノイズ、音節の欠落、音量の変化、アクセント、そして常に進化する単語の意味にもかかわらず、音声メッセージを理解する能力に驚くほど長けています。音声コマンドを理解するその能力に匹敵するAIはまだ存在しないため、あらゆる事態を想定して考えることがデザイナーや開発者に求められています。ここでは、優れた使用例をいくつかご紹介します。

VUIの活用事例
どんなデバイスやアプリでも音声で動作する可能性がありますが、だからといってすべてがそうあるべきとは限りません。インテリジェントなVUIの設計は、まず、話すことでユーザーの生活がより快適になる場所を検討することから始まります。例えば、ドライブスルーの窓口など、屋外で一般の人が使用するデバイスでは、音声の変化や環境ノイズなどの問題が多すぎます。また、健康情報や機密情報などのデリケートな情報を扱うときには、大声で話すことは絶対に避けたいものです。VUIは、ハンズフリーで使用することが有益なタスク（料理や運転アプリなど）、スマートホームデバイス、感情的な要素を持つアプリ（運動や生産性など）に最適です。ユーザー調査により、どこに摩擦点があるのか、VUIによってUXをどのように改善できるのかを正確に知ることができます。

VUIが情報を処理する仕組み

人間は1秒間に約39ビットの音声情報を処理することができるため、VUIは意味の曖昧さを犠牲にすることなく、できるだけ高速に情報を処理するように努めなければなりません。多くの場合、設計者は情報処理のために会話型AIを構築したり、この部分をオープンソースの音声認識エンジンに委託しています。ユーザーは、ゆっくりとした話し方や一語一語の話し方を要求されると、焦ってしまいます。また、世代的にコアな概念に馴染めないこともあります。例えば、「時計回り」や「壊れたレコード」などの表現は、若いユーザーには意味をなさないかもしれません。できるだけ多くの時間をかけてユーザーの会話に慣れ親しみ、そのリサーチに基づいてVUIの個性をデザインすることが大切です。情報処理を効率化するために、発話、コマンド、価値、意図の豊富なライブラリを構築します。

VUIをデザインする際の注意点

VUIのデザインプランにおいて、最初にして最も重要な要素は「カスタマージャーニーマップ」です。デザイナーは、ユーザーがエンゲージメントの各段階で最も必要としているものを特定します。すでに製品の実用版を発表している競合他社があれば、その作業の半分は競合情報によって簡単に把握することができます。そうでなければ、ユーザーからのフィードバックを集めるのに相当な時間がかかってしまいます。

VUIが何をしなければならないか、期待される成果を明記したマップがあれば、ユーザーペルソナの定義、VUIが様々なデバイスとどのようにつながるのか、トリガーのライブラリの定義に負担が移ります。

ユーザーペルソナ　

ペルソナを作成することは、ユーザーが何を達成したいのかをチームで共有するための重要な最初のステップです。VUIユーザーのペルソナは、名前、役割、期待などの通常の属性に加え、声のトーンや典型的な言葉の選択などの詳細を追加します。理想的には、VUIは、異なる人や同じ人でも異なる設定を自動的に認識できるほど堅牢であるべきです。例えば、スマート温度計では、"自宅で仕事をするとき "と "ゲストをもてなすとき "で異なるユーザーペルソナを設定することができます。スマートカーアプリでは、その日に運転する人に応じてラジオやナビゲーションの設定を変えることができます。

デバイス
音声対話に依存するデバイスには、主に4つのタイプがあり、それぞれに制約があります。それぞれのデバイス向けにデザインする際には、これらの要素を考慮してください。

電話 - デザインの仕様を慎重に検証し、環境の変化がVUIにどのような影響を与えるかを考慮します。グラフィックはユーザー入力のガイドに役立ちます。
携帯電話以外のモバイルデバイス - 車載用デバイスやラップトップは接続が断続的です。通常、音声だけが主要なUIではありません。
ウェアラブル - ほとんどは機能が制限されたシングルユースデバイスですが、電話またはラップトップアプリとペアリングされる場合があります
固定デバイス - おそらく複数のユーザーに対応する必要があり、周辺の他のデバイスと相互作用します。

VUIトリガー
また、トリガーとなるイベントには、主に4つのタイプがあります。

* 音声 - VUIを起動し、入力を行うための主要なトリガーです。
* 触覚 - マイクのようなボタンを押したり、ダイヤルを回すなどのコントロールを設定します。
* モーション - 多くの場合、ウェアラブルおよび固定デバイスは、人が部屋に入ったり手を振ったりしたときにアクションを実行します
* 期間の限定 - VUIは、特定の時間にユーザーにリマインドを与えるように設定することができ、また、目的とするゴールに到達したときにもリマインドを与えることができます。

また、自動車をベースにしたVUIでは、ユーザーが好みの小売店の近くを運転しているときに、必要なアイテムの購入をリマインドするなど、AR（拡張現実）データを取り入れることも始まっています。

UXとVUIのデザイン
ユーザーの期待に応えるVUIをデザインすることは、経験豊富なUXデザイナーにとっても非常に難しいことです。ユーザーは、アプリやデバイスがより多くの入力を必要とするときに調整することに慣れていますが、音声コマンドを繰り返すことの心理は異なります。VUIが何枚かのチケットを要求すると、"夫婦で "とか "私と妻だけで "といった答えが返ってくる傾向があります。すべての事態を想定することは不可能なので、デザイナーは、ユーザーが親しみを持って会話できるような魅力的なスクリプトを考えなければなりません。便利なリファレンスの1つは、数千時間の調査に基づいた会話開発に関するGoogleのガイドです。

アダプティブインターフェイスのデザイン

スペックは常に進化しており、根本的に新しいデバイスが次々と登場していますが、人間の声は当面の間、頼りになるユーザーインターフェースです。プロセッサーが小型化し、IoTであらゆるものが生き生きと動き出しています。登場する世界では、音以外のインターフェイスが入り込む余地はほとんどありません。音声の即時性と多様性は、ユーザーの欲求からデバイスの反応を直接結びつけます。しかし、VUIのメリットを享受するためには、デザイナーは詳細なペルソナから始めて、特定のデバイスの潜在的な制限を回避し、すべての潜在的なアクショントリガーを最大限に活用しなければなりません。

開発->改善->繰り返し
どのようなプロジェクトであっても、反復的な改善は優れたデザインの基本です。デザインチームが協調し、連携するためのツールを持っていれば、コードをより早く改善し、より賢いデザインの選択を行い、今まで見たことのないような体験でエンドユーザーを驚かせることができます。

(本記事は2020/8/5投稿を翻訳したものです。)

いかがでしたでしょうか？読んでいただいてる皆さまにとって、何かのヒントになったなら嬉しいです:)

ここまで読んで頂き、ありがとうございました:) Have a nice day!