Seeing AIすげー
どうも今回はMicrosoftのAI認識ソフト「Seeing AI」の紹介です。
Seeing AI
seeing AIとは
だそうです。前に「ラストマン」にて主人公が耳にかけていた小型カメラ見たいなやつです。
androidとiOSにそれぞれアプリがありました。
使い道
アプリを起動するとカメラで前方が映されるので、下のバー(赤丸)から機能を選択して撮影します。そうするとAIで画角内の情報を判断して読み上げたりしてくれます。
機能
テキスト
表示されているテキストをリアルタイムで読み上げてくれます。
ドキュメント
リアルタイムではなく、ドキュメントを撮影(自動でもシャッターボタン)してテキストを抽出できます。
左下の再生ボタンで読み上げます。また左下の共有ボタンから画像かテキストで共有できます。右上のペンマークでページの削除や再スキャンができます。ペンマークの左のボタンはページの追加です。
とりあえず家に転がってた古い説明書をスキャンしてみます。
読み取り中の効果音が結構うるさい…
製品
バーコードの読み取りです。
ただ自分の環境ではApple Pencilの白箱とmx keys mini for Mac の製品ボックスの二次元コードをスキャンしようとしましたが、認識されなかったりしてまだ使えないかなぁと言った感じ。もしくは日本環境だからかな?
シーン(プレビュー)
これが冒頭で言った「ラストマン」の話です。
まだプレビュー版ですが撮影した写真の内容を認識して音声で読み上げられます。これが結構楽しくて、マウスを写せばマウスと認識されますし、キーボードはキーボードと言ってくれます。
ただMac mini とかの一般的でない形状のものは認識できないですね。
人(顔)認識
人の顔で認識できるようです。
だそうです。実際にやったことはないですが、人の顔と名前を登録しておけば人を認識できます。ただ自分の顔を登録してみたのですが、あまり精度はよくないと思います。自分の環境かもしれませんが。
通貨
どうやら国を選んで、紙幣(硬貨も?)を読ませると金額(アプリでは価値となっているが)を認識できるようです。
色
単純に色を認識できます。ただフラッシュを焚かれると問答無用で白になってしまいます。
光
光量を音のトーンで認識できます。音楽になりそうなならそうな感じです。YouTubeで定規演奏みたいなのしてる人には良さげなツールです。
使用感
全体的な使用感としてはまだ開発途上と言った感じです。機能によってはプレビューとの表記がある場合もあるので、まだ本格リリースと言った感じではないのかも知れませんが、sf見たいな世界観が近くなったなーと言った感じです。
まとめ
Microsoftの画像認識アプリ「Seeing AI」についてでした。sfチックな世界観が近づいてきたなぁと感じたところです。