画像分類と物体検知は何が違うの?
おひさしぶりです!
毎年5月病にはならないのに、6月に気持ちがどんよりしがちな、ヒューマノーム研究所のえりこです
こんなときは、さっぱり美味しい冷やし中華でも食べて、元気をだしたいところです。さっぱり美味しい麺類は、高温多湿な日本に住む人々に心の安息を与えてくれますよね。
さて、いきなり話が変わりますが、私の知り合いに麺類が大好きすぎて、麺類を画像で判定するAIを作成しようと奮闘している方がいます。麺料理には古今東西さまざまな種類のものがあるので、AI開発はかなりやりがいがありそうです!
職業柄、どうしてもAI開発と聞くと気になってしまい、進捗について聞いてみたところ、ものをみわけるAIには様々な手法があるものの、その違いがふんわりとしか理解できず、あまり本人の納得のいくAIがつくれていない、という返答がありました。
こんな憂鬱なことはありません。やりたいことにあわせて手法を選んで、ナイスなAIを作りたいものです。
そこで、今回は画像認識の中でも基本的な手法である「画像分類」と「物体検知」の違いについてご紹介していきたいと思います。当社が開発している Humanome Eyesは物体検知を得意としているので、是非本日の記事をお読みいただければと思います。
画像分類:「冷やし中華」の写真なのか、「そうめん」の写真なのかを知りたい
最初は「画像分類」と呼ばれる手法についてお話していきます。
画像分類は、画像全体に何が写っているのかを認識し、分類する手法です。写真全体が何の写真かを判定したい場合に使います。例えば、以下のような時です。
写真に写っているものが「そうめん」なのか「冷やし中華」なのかを判断したい
写真の中に部品が一つだけ写っていて、不良品なのか良品なのかを判断したい
写真に写っている動物が、「イノシシ」「くま」「ねずみ」なのかを判断したい
写真全体に大きく1つだけものが写っていたりなど、写真全体が何の画像であるかを判断したい場合は、「画像分類」と呼ばれる手法を選ぶのが適切です。
物体検知:「冷やし中華」が何皿写っていて、「そうめん」が何皿写っているのかを知りたい
続いて「物体検知」と呼ばれる手法について解説します。
物体検知は、画像の中にある特定の物体を見つけて、その場所を認識する手法です。写真の中に写っている「なに(みつけたいもの)」が「どこ(写真のどの位置)」にあるかを判定したい場合に使いましょう。例えば、以下のような時です。
写真に写っている「そうめん」と「冷やし中華」がそれぞれ何個存在するのかを判断したい
写真の中に部品がたくさん写っていて、良品と不良品がそれぞれ何個存在するのかを判断した
写真に写っている動物が「イノシシ」「くま」「ねずみ」のそれぞれどの動物であるかを判断し、写真の中のどこにいるかを判断したい
画像の中に見つけたい物が複数写っていて、「どこ」に「なに」があるのかを知りたい時に適しています。
物体検知をするAIを作りたい・・・!と思われた時は、ぜひ Humanome Eyes をお試しください!Humanome Eyesは物体検知を行うAIを開発するのに適したツールです。リアルそうめんとリアル冷やし中華をいくつか揃えていただたら、プログラミングがなくてもAIを開発できるツールなので、どなたでもすぐに上の予測結果を再現できます。
画像分類と物体検知の比較
ここまでのお話と、両手法の長所と短所を以下にまとめました。
画像全体に何が写っているかを判断したい場合は「画像分類」、画像内の「どこ」に「なに」があるかを判断したい場合には「物体検知」、といった具合に、目的に応じてそれぞれの手法を選ぶことをお勧めします。
AIも人間と同じように、手法による得意・不得意があります。得意なことを得意なAIに行ってもらうように、手法をうまく選んで、開発・利用していただけるといいな!と思っています。
おわりに
今回は、どちらも画像を認識するための技術である「画像認識」と「物体検知」の違いについてご紹介しました。
もし、物体検知AIをプログラミングなしで作成したくなったら、Humanome Eyesをご利用いただくと、みなさんのAI作成をサポートできるかもしれません。Humanome Eyesの操作方法は、過去記事で紹介していますのでよろしければぜひご覧ください。
じめじめした6月を、冷たい麺類を食べながら、楽しく過ごせることを願っています!
データ解析・AI構築の初学者向け自習テキスト
表データを利用したAI学習テキスト(Humanome CatData)
画像・動画を利用したAI学習テキスト(Humanome Eyes)
AI・DX・データサイエンスについてのご質問・共同研究等についてはお気軽にお問い合わせ下さい!