YOLOv1：You Look Only Onceの最初のバージョンを解説します

2022年11月17日 08:42

この記事で学ぶこと

YOLO（You Look Only Once）はワシントン大学のJoseph Redmonらによって開発された物体検出の深層学習モデルです。ほぼ同時期に発表されたFaster R-CNNのRoss Girshickが共同研究者として名を連ねています。

ちなみに、YOLOの最初の論文がarXivで発表された際、Ross GirshickはMicrosoftの研究チームに在籍していました。Joseph Redmonが在籍しているワシントン大学もシアトルにあり、マイクロソフトのオフィスに近いので彼らの間には親しい交流があったのかもしれません（憶測ですが）。

YOLOとFaster R-CNNには構造的に似たところもありますが、違いが多くあります。特に注目すべき点はYOLOの方がはるかにスピードが速くなっているところです。この記事では、この辺りを詳しく解説します。

YOLOの論文の第４版がarXivに発表された際にはRoss GirshickはFacebookの研究チームに移籍しています。それと関連があるかは分かりませんが、YOLOv2の論文にはRoss Girshickの名前はありません。研究者として別の道を辿ったと思われますが、Ross GirshickはFaster R-CNNを改良してMask R-CNNへと発展させたのに対し、Joseph Redmonは研究をやめる旨を発表しています。

この記事では、上記のバージョンのYOLOをYOLOv1と呼び、その後のバージョンと区別します。Joseph RedmonはYOLOv3まで開発しました。YOLOと名の付くモデルにはYOLOv5などいろいろとありますが、Joseph Redmonによるものではありません。

ここから先は

3,324字 / 7画像

キカベン・読み放題

¥1,000 / 月

初月無料

アルゴリズム、機械学習、深層学習、強化学習、量子技術をわかりやすく

すべての記事とマガジンが読み放題
メンバー限定の会員証が発行されます
活動期間に応じたバッジを表示
メンバー限定掲示板を閲覧できます
メンバー特典記事を閲覧できます
メンバー特典マガジンを閲覧できます

このメンバーシップの詳細

ログイン

この記事が気に入ったらチップで応援してみませんか？