ラズパイで物体検出 3
最近はChatGPTや生成AIなど人工知能(AIモデル)に触れる機会が増えてきましたね。
このコラムではディープラーニング(深層学習)を用いた物体検出をご紹介しようと思っていますが、
せっかくだから独自に学習を行ったAIモデルをラズパイ5で動かしてみようと考えています。
全3回を予定しています。
1.ラズパイ5紹介
2.ディープラーニングモデルのYOLO紹介
3.教師あり学習と実動作←現在地
3.教師あり学習と実動作
前回まででラズパイ5とYOLOをご紹介しましたが、今回はYOLOによるディープラーニングでAIモデルを作成し、ラズパイ5で動画再生しながらリアルタイムに物体検出を行ってみます。
リアルタイムに物体検出を行うにはかなりの処理スピードが必要となってきますが、ベストタイミングの2024年6月にNPU(Neural Processing Unit)が搭載された「Raspberry Pi AI Kit」が発売となりました。
NPUはAIプロセッサとも呼ばれAIモデルの推論を高速に行う半導体です。これを使えばリアルタイム処理が万全だと思うのですが、残念ながら色々な販売サイトを確認しても「在庫切れ」でポチることができませんでした(涙)。人気なのですね。
仕方なくラズパイ5のCPUパワーで物体検出を行うことにします。
しかし、ラズパイ5のCPU処理性能が上がっているし、YOLOの処理スピードも速いので、どれくらいの性能になるのかも興味があります。
検出する物体は入手しやすい日本硬貨にしました。
教師あり学習では文字の通り教師データが必要になるのですが、その前に被写体となる硬貨を集める必要があります。
硬貨の和暦や製造年をできるだけバラバラにしたいと思い、家族にもお願いして各20枚ほど集めました。
集めた硬貨をスマホで沢山&た~くさん撮影してパソコンに取り込み、取り込んだ画像に専用ツールを使って「どこに」「何が」写っているのかを四角で囲んでいきます。こんな感じです。
地味な作業ですが、間違いや付け忘れはAIモデルの性能を悪化させることになるため、右手のマウスを慎重に操作し、左手の缶ビールで渇いたのどを潤すことも大事です。
全ての画像の作業が終わって、やっと教師データの出来上がりです。8割を学習用に、2割を検証用に分けます。
次は教師データを使って学習を行うのですが「Raspberry Pi AI Kit」が入手できなかったため学習はパソコンで行いました(汗)。
学習は、何回も繰り返すことで画像の特徴を絞り込んでいくのですが、回数が少ないと学習不足で性能が出ないし、あまりに繰り返すと役立たずの特徴となる特性もある(過学習)ため、学習不足と過学習の間を狙って学習回数を決めます。
う~ん・・・小難しくなってきたのでさっさと結果をみましょう。
出来上がったAIモデルをラズパイ5にコピーして動かした動画です。
そこそこの精度でしょうか。
それよりラズパイ5とYOLOの性能の良さでしょうね、動画のカクカク感が想像以上に少なく、なかなかの結果となりました。
世はまさに大海賊時代・・・ではなくて、DX(デジタルトランスフォーメーション)で社会やビジネス、生活の形・スタイルがどんどん便利になっている時代ですね。
私たちの技術でみなさまのお役に立てることが、もっともっと増えればと願っています。
最後まで見ていただき、本当にありがとうございました。