見出し画像

最新物体検知モデル「YOLO11」を試してみる


はじめに

こんにちは!この記事では、最新のディープラーニング物体検出モデルである「YOLO11」を取り上げます。
YOLOシリーズは、その高速な推論速度と高い精度から、リアルタイム物体検出の分野で広く活用されています。今回紹介するYOLO11は、前世代(YOLOv8など)からさらなる改良を重ね、精度・速度・汎用性を強化した注目のモデルです。

この記事を読むと、以下のポイントがわかります。

  • YOLO11が前バージョンからどのような点で進化したのか

  • Google Colabを用いた簡単な実装方法

  • 実際の画像を用いた推論例とその考察

  • 産業応用の可能性

ぜひ最後までお付き合いください。

YOLO11 について

YOLO11はUltralytics社が開発する最新のリアルタイム物体検出モデルです。
以下は主要な改良点と特徴です。

  1. 強化された特徴抽出:
    バックボーンやネックアーキテクチャに新規コンポーネントを導入。例えば「C3k2」(Cross Stage Partial構造の改良)や「C2PSA」(空間注意機構付き畳み込みブロック)により、特徴マップの抽出効率と精度が大幅に向上しています。これらのブロックは、微細な物体や複雑な背景からも有用な特徴を抽出します。

  2. 効率と速度の最適化:
    アーキテクチャ設計やトレーニングパイプラインが精緻化され、モデルサイズや演算量を抑えつつ高精度を維持。エッジデバイス上でもリアルタイム推論が可能です。

  3. パラメータ削減による高精度化:
    YOLO11mはCOCOデータセットでYOLOv8mより22%少ないパラメータでより高いmAP(平均精度)を実現。軽量化と高精度化を両立しています。

  4. 多環境への適応性:
    クラウド、オンプレ、エッジデバイス、NVIDIA GPUといった幅広い環境で容易に展開できます。

  5. 幅広いタスクのサポート:
    物体検出だけでなく、インスタンスセグメンテーション、姿勢推定(Keypoint Detection)、指向性物体検出(OBB)、画像分類など、多様なビジョンタスクに対応しています。

下図はYOLO11のアーキテクチャ概念図(引用元:論文Figure1)。C3k2やC2PSAなどの新規コンポーネントが、様々なタスクに対応可能な汎用性を生み出しています。

これらの改良により、YOLO11は先行モデル比で精度・速度・効率性が飛躍的に向上しています。

上図(Ultralytics社 YOLO11公式サイトより)より、v10から変わらないか、わずかに向上した速度・精度であることが示されています。

Google Colab での簡単実装例

ここでは、Google Colabを用いてYOLO11モデルによる物体検出推論を試します。
サンプル画像にはCOCOデータセットの写真を用い、精度をざっくりと確認してみます。
環境構築とモデル読み込み

YOLO11には、以下のようなバリアントが用意されており、タスクや環境に合わせて選択可能です。

各バリアントごとにパラメータ数やmAP、推論速度は以下のように比較されています。
軽量モデル(n)でも十分な精度が得られ、エッジデバイスでのリアルタイム推論にも期待できます。

参考文献・参考資料

推論例1:人物検出
results_person = model("https://farm8.staticflickr.com/7359/8893656252_327c30e295_z.jpg")
results_person[0].show()

入力画像
検知画像

後ろの人物がピントぼけして、重なっているので精度が落ちると予想していたのですが、しっかりと検知できているように思えます。 特徴抽出機構の改善により、半透明な影や曖昧な領域でもロバストに検出できる点は特筆すべきです。 ほかにも、YOLO は細かい物体検知が苦手なはずなので、白黒の鳥たちの写真でも試してみます。

推論例2:小物体(鳥)の検出
YOLOは従来、小さくてコントラストの低い物体の検出が難しいとされてきました。そこで、白黒の小さな鳥が多数写った画像で試します。

入力画像
検知画像

ピンぼけや背景の複雑さがあるにもかかわらず、小さな鳥たちをしっかり検知できています。一部、確信度が低いものもありますが、全体として優れた検出精度を持っていることがわかります。
また、2つとも動作も軽量で使いやすいと感じました。
以下に今回実装したGoogleColab のワークブックへのリンクを貼っておくので、よかったらアクセスしてみてください。
https://colab.research.google.com/drive/1yzT6jlj_JpfqN4X21KCdUDXZRRxWqlAp?usp=s haring

まとめ

はじめてYOLO を使用してみたところ、その高い精度、軽量さ、そして使いやすさに感銘を受けました。論文で述べられている通り、YOLO は多環境での適用性に優れており、さまざまな産業への応用の可能性を秘めています。
例えば、物流業界や小売業界では、在庫管理や商品の検品に活用することで業務の効率化が期待されます。また、農業分野では、作物の成長状態の監視や病害虫の早期検出といった用途で、持続可能な農業の実現に貢献するでしょう。
これらの特長を活かすことで、新たなイノベーションを生み出し、より良い社会の構築に寄与すると確信しています。弊社としても積極的に活用していけるようにしていきたいです。
執筆担当:JINGS エンジニア兼データサイエンティスト 長屋篤典


参考文献・参考資料

「How to Use Ultralytics YOLO11 for Object Detection and Tracking| How to Benchmark | YOLO11 RELEASED」
https://youtu.be/-JXwa-WlkU8?si=BkKk5SZpEDXCz7k_
Ultralytics 社 yolo11 サイト
https://docs.ultralytics.com/ja/models/yolo11/
note 「YOLO11 を試してみた」
https://note.com/thomasmemo/n/n3cc19710e8fe
論文「YOLOv11: An Overview of the Key Architectural Enhancements」
Rahima Khanam, Muhammad Hussain.,arxiv.2024
https://arxiv.org/abs/2410.17725

いいなと思ったら応援しよう!