見出し画像

ラズパイで物体検出 2

前回の内容はこちらから!↓

最近はChatGPTや生成AIなど人工知能(AIモデル)に触れる機会が増えてきましたね。

このコラムではディープラーニング(深層学習)を用いた物体検出をご紹介しようと思っていますが、
せっかくだから独自に学習を行ったAIモデルをラズパイ5で動かしてみようと考えています。

全3回を予定しています。
1.ラズパイ5紹介
2.ディープラーニングモデルのYOLO紹介←現在地
3.教師あり学習と実動作


2.ディープラーニングモデルのYOLO紹介


https://docs.ultralytics.com/ja

物体検出って聞いたことがある人は少ないですよね。画像のどこに何が写っているのかを検出することを物体検出といいます。
この物体検出は製造業の外観検査や医療など、あらゆるところで幅広く活用されていて、自動車の自動運転はテレビCMでみなさんも目にしたことがあると思いますが、自動運転にもこの技術が活用されています。

最近の物体検出では迅速に精度良く検出するためにディープラーニング(深層学習)で学習したAIモデルにて検出を行います。
ディープラーニングの先駆けはR-CNN(畳み込みニューラルネットワーク)ですが、リアルタイムに物体検出を行うためのスピード改善や精度向上の研究開発が行われて、2015年に発表されたのがYOLOです。
(ここでやっと)YOLOとは、物体検出の際に使用される代表的なアルゴリズムで「You Only Look Once」の頭文字をとっています。
ありがたいことに学習済みのAIモデルも提供されていて、検出した物体を四角で囲う物体検出(Detect)の他にも、物体の輪郭まで検出する Segment や人の姿勢を検出する Pose など色々と提供されています。


発表された2015年以降も日進月歩で改良が行われて新しいバージョンが出ています。
AI分野のコンピュータビジョン・パターン認識分野において世界最高峰の
CVPR(Conference on Computer Vision and Pattern Recognition)学会があり、いくつかのバージョンの論文が学会に採択されているようです。知らんけど!
なーんかよく分かりませんが「すごい」ってことなのでしょう。

今回はultralytics社が開発したYOLOv8を使用することにします。
YOLOを動作させるにはPythonが必要になりますが、パイOSに標準でインストールされていました。
あとはYOLOをインストールしてプログラムを書いて動作させます。
最近は複雑なプログラムを沢山書かなくてもドラッグ&ドロップでプログラム開発ができるノーコード/ローコード開発が流行ってますが、YOLOではプログラミングが必要です。
ただ、初心者でも扱えるように配慮されていて、数ステップの簡単なプログラムで動作確認ができました。

人とバスを検出しています。文字の右側にある数字は信頼度を表していて1.0が最高値となりますが、高い信頼性で検出できてます。
人やバス以外にも車やバイク、自転車、机、椅子、飛行機、犬、猫など80種類の検出ができます、確かに「すごい」ですね。

ディープラーニングモデルのYOLO紹介はここまでです。
次回は最終回、YOLOを用いて学習を行って、ラズパイ5での物体検出を紹介予定です。


いいなと思ったら応援しよう!