
【初心者OK】MicrosoftのAI”Computer Vision”をノーコード&無料で使う(1)
Microsoftから提供されている画像やビデオのコンテンツを分析するAIサービス「Computer Vision」をノーコードで利用できる方法を構築してみました。自分自身Computer Visionは初めて触ったので、いろいろ引っかかったところがあり、その経験も踏まえて書いておきます。
第1回目では、Computer Visionを動かせるようにします。
AIサービスは誰もが開発できる時代に
AIで写真に写っている物体を認識するといったニュースは、最近では頻繁に耳にするようになりましたが、何だか「凄い人が凄いことやってる」ようなイメージがあると思います。
しかし現在では、一般的なタスクであればMicrosoftやAmazon、Google等が開発した出来合いのAIを利用することで「普通の人が凄いことやれる」環境になってきています。これを使わない手はありません。
今回はさらに、プログラミングを一切行うことなくノーコードでAIサービス構築を目指します。
Computer Visionとは?
今回利用するComputer VisionはMicrosoftが作った画像認識用のAIです。画像に写っている物体を認識したり、画像内の文字を抽出する(OCR)などができます。詳しくはMicrosoftのComputer Vision概要ページを見てください。
なんと、このComputer Vision、月5000トランザクションまでは無料で利用できます。お試しレベルであれば無料で十分行けます。
Computer Visionの使用を開始する
1)Azureアカウントを無料で作成します
詳細はこちらのWebページを参照してください。
2)Azure PortalにサインインしComputer Visionを追加します
Azure Portalのホーム画面にて[リソースの作成]をクリックします。
「Computer Vision」を検索して、[作成]ボタンをクリック。
下図のような感じで設定してComputer Visionを作成します。
APIコンソールでサービスを試す
Azure Portalから先ほど作成したComputer Visionを開きます。[キーとエンドポイント]を開き、内容を確認しておきます。(後で使います)
まずは動作を確認するために、APIコンソールを開きます。
今回は物体検出APIを利用したいので[Detect Objects]を選択します。
利用するRegion(地域)はJapan EastかJapan Westを選択しておくといいでしょう。
Headersの[Ocp-Apim-Subscription-Key]の欄に警告が出ています。ここに[キーとエンドポイント]の[キー1]をコピーして貼り付けます。
Request Bodyのところで画像のURLを指定するようになっています。デフォルトで入っているのはダミーURLなので書き換えます。今回はとりあえずhttps://farm4.staticflickr.com/6002/5988662896_2be0a43b9d_o.jpgを使ってみることにします。
早速[Send]をクリックしてComputer Visionで識別させてみましょう。
Response Statusが200で返ってくれば正常終了です!(400とかで返ってくるときは設定を見直してください)
Computer Visionの識別結果を見てみましょう。objectがairplane(飛行機)となっているので正しく識別されています。confidenceは信頼度のようです。ちなみにrectangleは識別した領域(飛行機が写っている領域)を表しています。
と、このようにしてAPIコンソールを使えば簡単にComputer Visionを利用することができます。次回は、APIコンソールに代えてノーコードツールでComputer Visionを利用してみます。
(雑感)Computer Visionも使い手次第
APIコンソールで様々な画像を認識させてみると得手不得手があることがわかります。特に一部が欠けているような画像だと認識精度が悪くなるようです。
AIには必ず誤差はつきまとい、なぜそうなったのかよくわからない結果を返すこともあります。それを使いこなすのは人間の仕事です。AIを使ったサービス開発では、どんな情報を入力して、どんな結果が返ってくるのを期待するのかを、よく考えておく必要があると思います。