G検定 ILSVRCの歴史 2012 ~ 2014

株式会社リュディアです。今回はG検定公式テキストでも頻繁に参照される ILSVRC の歴史についてまとめてみたいと思います。今回は 2012 ~ 2014 の歴史です。

ILSVRC ( ImageNet Large Scale Visual Recognition Challenge ) は 2010年に始まり、2012年にチーム SuperVision が発表した AlexNet が圧倒的なレベルで優勝し、2017年を最後に終了していることは知っておいてください。ここで ILSVRCの最初の I を表す ImageNet はスタンフォード大学が集めたテスト画像の集合です。ImageNet については別途まとめます。

ILSVRC 2012

2010年から始まっていますが2012年はトロント大学の Hinton 率いるチーム SuperVision が発表した AlexNet が圧倒的なレベル差で優勝しました。SVM (サポートベクターマシン)を中心とした技術が中心であった大会を CNN 中心に置き換えたきっかけとなったものです。原論文は "ImageNet Classification with Deep Convolutional Neural Networks" です。活性化関数として ReLU が導入された、Dropout 技術が用いられた、など現在の DNN 技術の原型となったモデルが考案された記念すべき年でもあります。

ILSVRC 2013

NY大学の ZFNet が優勝しました。ZF は2人の著者 Zeiler と Ferbus のイニシャルからとっていると思われます。原論文は "Visualizing and Understanding Convolutional Networks" です。2012年に優勝した AlexNet の問題点を明確化し、それに対応する改良を施した CNN と言えます。

ILSVRC 2014

当時の Google Xlab が GoogLeNet で優勝しました。原論文は "Going deeper with convolutions" です。AlexNet や ZFNet と比較して層数が 5から 21層に増えていることに特徴があります。計算機資源が対応できるのであれば層数と層間の結合数を増加させると精度があがるということが知られ始めてきた時期と重なります。他にも Inception module や Global Average Pooling といった特徴的な技術が導入されています。

2014年は準優勝とはいえ Oxford 大学の VGGグループが発表した VGGNet も話題になりました。 原論文は "VERYDEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION" です。VGGは著者らが所属する Visual Geometry Group の略語です。論文では深さと検出精度の関係に関する深い洞察を与えています。

2015年以降は以下にまとめています。

では、ごきげんよう。

いいなと思ったら応援しよう!