seeing AIアプリ関連の話 - 文字認識したドキュメントについてお尋ねできる機能「Ask Seeing AI」
MicrosoftはOpenAIのChatGPTを採用した機能を次々に発表していますが、Seeing AIアプリにも実装されています。
ドキュメントのチャンネルで文字認識した内容をchatGPTで解析させることができます。
シーン、写真の内容についても詳しい説明をしてくれます。写真の内容については質問する機能はありません。
ただし、現時点では日本語環境では利用できません。
操作の手順としては、Documentチャンネルで文字認識させると「Ask Seeing AI」というボタンが表示されます。
それを実行するとエディットボックスが現れるので、質問を文字入力してSendボタンをタップします。
日本語で質問できますが、答えは英語でした。
Pixel 7, Android 13、端末の言語は英語に切り替えて試しました。
もし端末の言語を日本語のまま、Seeing AIアプリの言語を英語に指定することができるのであれば、答えは日本語で返ってくると思われます。
実はiOSではそれができるので、答えは日本語で表示されます。
この機能は、文字認識した文書の中から電話番号だけを知りたいとき、そんなばめんで活用できます。
すでにエンビジョングラスでは可能になっている機能でした。
しかし、Ask Seeing AIが興味深いのは複数ページに渡って文字認識した内容に対しても質問できることです。
エンビジョングラスの場合は1ページごとでないと解析してくれません。最新バージョンでは違っているかもしれませんが、今もたぶんそのはず。
早く日本語環境でも使えるようになってほしいものです。
センスプレーヤーでも利用できるようになると、ユーザは一気に増えるでしょうね。
先日アメリカで開催されたSight Tech GlobalのイベントでもSeeing AIのセッションがあり、MicrosoftからSaqib Shaikhさんがスピーカーとして出演されておられました。
その様子は動画でも視聴できますが、transcript 書き起こしテキストも公開されています。
The 2023 Agenda - Sight Tech Global
https://sighttechglobal.com/2023-agenda/
とくに目新しい情報はなさそうでした。
が、先日発表されたウェアラブルのデバイス、Humaneのai Pinの話題に対して、Seeing AIの機能を実装したい。
そのようにSaqibさんはx発言されておられました。
今後のSeeing AIの動きには注目、いや、注耳でしょうかね。