【初心者向け】はじめての画像認識AIテキスト：第1回「ものをみつけるAIとは？」

2021年8月26日 13:07

こんにちは、ヒューマノーム研究所インターンの塩谷です。

2021年7月19日に、画像を利用したAI構築の概要を学ぶ「はじめての画像認識AIセミナー」を開催しました。小学生からシニアの方まで幅広い年齢層のみなさまに、当社が開発するノーコードツール「Humanome Eyes」を使った物体検知AI（ものをみつけるAI）の作成を体験いただきました。

本セミナーは気軽にAI構築を体験してもらうことを目標としていたため、60分間という比較的短い時間での実施でした。もっとじっくりとAI構築の流れを学びたい、という方もいらっしゃったかと思います。

そこで今回からこのセミナーの内容をベースとして、物体検知AIの作り方や、AI開発に関する発展的な情報を数回に渡ってお伝えしていきます。よろしければ、AI学習の一助としてお読みください！

1. 物体検知AIには何ができるのか？

今回の連載を読み終えた時、物体検知AIをこんな風に使いたい！と思っていただければ、とても嬉しく思います。そこで第1回目である今回は、物体検知AIができることについて理解を深め、どんなことに使いたいかを想像できるようになることを目標にします。

物体検知AIはその名の通り、画像や動画に写っている物体を検知し、位置（画像の中でどこにあるのか）と種類（物体の名前）を示し、種類ごとに物体の個数を教えてくれます。しかし画像に写っている全ての物体について教えてくれるとは限りません。

例えば、猫の画像のみで学習したAIモデルは、犬について特定することはできません。つまり、物体検知AIは学習した種類の物体についてのみ特定できるということです。

大量の画像や動画から見つけたい「何か」が決まっているとき、その作業を自動化したいときに物体検知AIは大活躍します。実社会でも、これまで人間が目視で行っていたコンクリートのひび割れ点検の自動化、ドローン映像を用いた農薬散布の必要な地点の特定など、さまざまな場面で利用されています。

自分なりの活用法をイメージすることができたでしょうか？　次は物体検知AIを作る手順についてお伝えします。

2. 物体検知AIを作るための3つのステップ

物体検知AIは、下図のように「1. 画像を集める　2. アノテーション　3. AIに学習させる」の3ステップで作成することができます。

これだけでは何のことかわからないかと思いますので、ここからは3つのステップについて詳しくご説明します。

STEP1. 画像を集める

はじめに特定したい物体が写っている画像や動画を用意します。一般的に、学習に使用する画像を増やせば物体検知AIの精度は上がります。

同時に、どんな画像を集めるかということも精度を高める上で重要です。見つけたい物体の画像を、以下のような方法で集めてみましょう。

・見つけたい物体を角度を変えて撮る
・背景を変えて撮る
・被写体とする個体を変えてみる

色々な画像が必要となる理由は（STEP3. AIに学習させる）にてお伝えします。

STEP2. アノテーション

先ほどにもあったように、物体検知AIは、特定したい物体の画像からその特徴を学習することにより、物体を特定できるようになります。しかし、ただ画像を与えるだけでは、AIは完成しません。画像と、その画像のどこに特定したい物体があるのかという情報をセットにして学習させる必要があります。

この情報を付け加えること（またはその情報自体）をアノテーションと呼びます。難しく聞こえるかもしれませんが、Humanome Eyes では、画像に写っている物体をマウスで四角く囲む、という簡単な操作だけでアノテーションを行うことができます。

STEP3. AIに学習させる

学習と呼ばれる工程において、AIは学習画像とアノテーションを用いて、物体を特定するための色や形に関する共通のルールを導き出します。そのルールを使って、見たことのない物体に対して、それが学習した物体であるかどうか判断していきます。

AIは学習内容を暗記するのではなくルールを学ぶため、判定にはある程度の融通が効きます。しかし学んだルールが偏ったものであると、物体の見た目の多様性に対応できなくなってしまいます。

例えば、ネコを特定することを目標として、ミケ猫の画像だけ使って学習したとします。AIはミケ猫しか知らないので「ネコとは黒、白、茶が含まれている」という偏ったルールが導き出されてしまう可能性があります。すると、白猫や黒猫はネコと特定できません。

白猫や黒猫、さらにはどんな姿勢の、どんな写り方のネコでも特定するには、その分さまざまな画像を学習させる必要があります。それによって汎用性の高いルールが導き出せるようになります。

3. AIモデルが完成したら終わり！ではない

完成したAIモデルが初めから満足のいく精度を出すとは限りません。実用に移る前に、まずは作成したAIが、まだ見たことのない画像を用いて精度を評価します。

精度が低ければAIモデルを作り直し、再び精度を評価する必要があります。目標としていた精度が出たところで、はじめてAIモデルの完成となります。

AI構築において、精度の評価と、その評価を参考にした再構築は必要不可欠な部分といえます。どうしたら精度を高められるか、試行錯誤を重ねながら目標の精度を目指していきましょう。精度の評価方法や精度を高めるための方法については、後日の記事にて詳しくお伝えしていきます。

4. 次回のお知らせ

今回は、物体検知AIについての基本的知識とAI作成の全体的な流れについてお話しました。自分なりの活用方法や、実際の作成手順をイメージしていただけたでしょうか？

次回はHumanome Eyes の操作方法をご説明しながら、身近なお菓子の画像を使って物体検知AIを作成していきます。どうぞお楽しみに！

※ 筆者紹介
塩谷明日香（慶應義塾大学環境情報学部1年）：人間と機械の知能の両方に興味があります。好きなことは模様替え。機械学習やプログラミングは学び始めたばかりの見習いです。
---
私たちは今年度から当社でインターンシップを始め、ワークショップのTAや機械学習ツールの使い方の紹介記事を執筆しています。今後も、AI構築の実際についてご紹介していきますので、お読みいただけると嬉しいです！

この連載は以下のリンクからまとめて読むことができます。

「表データでAIを作りたい！」という方向けテキスト

ペンギンについて調べた表データを使って、一連のAI構築・データ解析の流れを学べる無料テキストをnoteで公開しています。AI学習の最初の一歩にぜひお役立て下さい。

AI・DX・データサイエンスについてのご質問・共同研究等についてはお気軽にお問い合わせ下さい！