見出し画像

YOLOv1:You Look Only Onceの最初のバージョンを解説します

この記事で学ぶこと

YOLO(You Look Only Once)はワシントン大学Joseph Redmonらによって開発された物体検出深層学習モデルです。ほぼ同時期に発表されたFaster R-CNNRoss Girshickが共同研究者として名を連ねています。

ちなみに、YOLOの最初の論文arXivで発表された際、Ross GirshickはMicrosoftの研究チームに在籍していました。Joseph Redmonが在籍しているワシントン大学もシアトルにあり、マイクロソフトのオフィスに近いので彼らの間には親しい交流があったのかもしれません(憶測ですが)。

YOLOとFaster R-CNNには構造的に似たところもありますが、違いが多くあります。特に注目すべき点はYOLOの方がはるかにスピードが速くなっているところです。この記事では、この辺りを詳しく解説します。

YOLOの論文の第4版がarXivに発表された際にはRoss GirshickはFacebookの研究チームに移籍しています。それと関連があるかは分かりませんが、YOLOv2の論文にはRoss Girshickの名前はありません。研究者として別の道を辿ったと思われますが、Ross GirshickはFaster R-CNNを改良してMask R-CNNへと発展させたのに対し、Joseph Redmonは研究をやめる旨を発表しています。

この記事では、上記のバージョンのYOLOをYOLOv1と呼び、その後のバージョンと区別します。Joseph RedmonはYOLOv3まで開発しました。YOLOと名の付くモデルにはYOLOv5などいろいろとありますが、Joseph Redmonによるものではありません。

ここから先は

3,324字 / 7画像

キカベン・読み放題

¥1,000 / 月
初月無料
このメンバーシップの詳細

この記事が気に入ったらチップで応援してみませんか?