見出し画像

理想の音声なびを考えた 〜 襟元に横にしたスマホを装着する〜

【はじめに】
本稿では、自作の音声ナビで歩いた経験と、最新の生成 AI 技術を組み合わせた誘導デバイスを考察、提案する。

襟元に下げたスマホ端末、首ベルトに装着した複数のバイブレータ、端末で撮影した画像を解析するAIエンジン、この3者を統合的に機能させるコンセプトは、以下の通り。

【目が不自由なヒトが一人で歩けるためには】
これには、次の3つのタイプの誘導が必要になる。

① マクロ誘導
迷子にならずに目的地まで案内することであり、晴眼者ならこの誘導だけで足りる。ただ、画面の地図が見えないと、ルートの確認ができない。

② ミクロ誘導
これは、マクロ誘導ではカバーしきれない細部の誘導をさす。たとえば、コンビニの敷地に入ってから自動ドアの前まで誘導するのがこれだ。

③ 前方の状況に応じたリアルタイムでの細かな誘導
広い駐車場では、その時の状況に応じて、車の間をぬって進まなければならない。これには画像解析が有効だ。

【② ミクロ誘導の考察】
筆者は、田舎道でも歩けるように、最初からこの誘導を重視して「お散歩の友」という音声ナビを開発した。

下記は、その動作原理を説明する動画である。

「視覚障害者用音声ナビ、動作デモと開発の総括」


さて、ミクロ誘導は自立歩行ロボットの制御に似ている。
あらかじめ用意した経路地図と、ロボットの位置と向きを比較して、フィードバック制御する。
そんな難しい事を言わなくても、配膳ロボットが自分の委場所と向きを検出しながら歩いていることは容易に理解できる。

そこで大切なのは、センサーがロボットにしっかり固定されている事である。センサーがぶらぶらしていたらロボットもよたよた歩いてしまう。また、時間的な遅れがないことも重要だ。

この観点から、「お散歩の友」では、センサーを内蔵したスマホを左の肩に水平にしっかり固定して歩いている。

【③ 前方の状況に応じた誘導について】
さまざまなセンサーで障害物を検出して知らせる方法は以前から提案されている。しかし、それでは「行けない方向」は分かっても「行くべき方向」は分からない。

ところが、2024年になって、生成AIによる画像解析が格段に進歩し、AIと自然語で会話しながら、欲しい情報にフォーカスしておしえてもらうことが可能になった。

歩行者が撮影した前方画像を、遠隔地にあるサーバーに送って解析させるわけだ。たとえば、バスの行き先表示を狙って読ませることも可能になる。
なお、信号の色を検知する程度なら、オフラインでも実現できている。

【スマホを首に下げて保持する】
上記の3つの誘導方式を1つのデバイスで実現したい。
「肩のせ方式」では、カメラが下を向く。
そこで、小型のスマホを横倒しにして、背面を前に向けて、襟元、蝶ネクタイを結ぶ位置にホールドする方法を試した。

襟元に下げたスマホ端末

この方法でスマホはふらつかないか。実際にまっすぐな道を数百m歩いて端末のコンパスの値を計測した。

襟元に装着したときの方位角のブレの標準偏差
5.5度

左肩に装着したときの方位角のブレの標準偏差(現行)
4.8度

いずれもプラマイ6度のレンジに入っている。実用になる範囲だ。

【首のベルトにバイブレータをつける】
あしらせ2は、ホンダの技術者たちが手掛けている視覚障害者用の誘導デバイスである。
両足にバイブレータを装着して誘導する。
この振動による情報伝達は、直感的で時間遅れがないので快適に誘導できる。

これなら、のっぺりしたグラウンドなどでも誘導できそうだ。
だが、それは「外出のたびに足にデバイスを着けなければならない」という問題と裏腹である。

その点を踏まえ、筆者は「スマホ端末をぶらさげる首ベルトの、首と触れる個所に3個のバイブレータを着ける」ことを考える。

バイブレータは、あしらせに似たパターンで振動し、案内情報を伝達する。


首の裏


バイブレーターはスマホ端末と有線接続するので、電源や無線接続のわずらわしさから開放される。
なお、バイブレータ素子の選定、設計にはかなりの工夫が必要であろう。

【振動と自然語を併用して割り込みの問題を解決】
あしらせの優れた点は、歩行者への情報伝達を振動と自然語の2つで分担していることである。
振動では、主に進行方向に関する微妙な情報をタイムリーに伝える。
自然語による案内は、経路案内など、情報量が多い場合に使う。
2種類の情報を分担することにより、音声案内の最中でも方向修正の指示ができる。
なお、AIエンジンにつないで、対話で前方情景を説明させるときは、立ち止まる。
AI を呼び出す時の合図は、たとえば端末に重力方向に、特徴的な加速度を与えることでトリガーとすることが考えられる。 
極力、指での操作はしたくない。

【以上の総轄】
本稿で説明した装置では、襟元に下げたスマホ端末、首ベルトに装着した複数のバイブレータ、端末のカメラで撮影した画像の AI による解析を同時に実現する。

スマホ端末は、全体制御、モバイル通信、ユーザーとの間のインターフェイスをすべて担う。

この記事が気に入ったらサポートをしてみませんか?