YOLOv1:You Look Only Onceの最初のバージョンを解説します
この記事で学ぶこと
YOLO(You Look Only Once)はワシントン大学のJoseph Redmonらによって開発された物体検出の深層学習モデルです。ほぼ同時期に発表されたFaster R-CNNのRoss Girshickが共同研究者として名を連ねています。
ちなみに、YOLOの最初の論文がarXivで発表された際、Ross GirshickはMicrosoftの研究チームに在籍していました。Joseph Redmonが在籍しているワシントン大学もシアトルにあり、マイクロソフトのオフィスに近いので彼らの間には親しい交流があったのかもしれません(憶測ですが)。
YOLOとFaster R-CNNには構造的に似たところもありますが、違いが多くあります。特に注目すべき点はYOLOの方がはるかにスピードが速くなっているところです。この記事では、この辺りを詳しく解説します。
YOLOの論文の第4版がarXivに発表された際にはRoss GirshickはFacebookの研究チームに移籍しています。それと関連があるかは分かりませんが、YOLOv2の論文にはRoss Girshickの名前はありません。研究者として別の道を辿ったと思われますが、Ross GirshickはFaster R-CNNを改良してMask R-CNNへと発展させたのに対し、Joseph Redmonは研究をやめる旨を発表しています。
この記事では、上記のバージョンのYOLOをYOLOv1と呼び、その後のバージョンと区別します。Joseph RedmonはYOLOv3まで開発しました。YOLOと名の付くモデルにはYOLOv5などいろいろとありますが、Joseph Redmonによるものではありません。
この記事が気に入ったらチップで応援してみませんか?