見出し画像

分類AIの進化史⑤ImageNet

前回は、Metaのヤン・ルカンによる畳み込みニューラルネットワークであるLeNetについて解説しました。今回は、ImageNet(イメージネット)を解説します。

知っている人も多いとは思いますが、ImageNetはモデルの名前ではありません。いくつかの画像データセットを総括した名前です。2010年から2017年の間に行われた画像分類物体検出などのコンペティションで使われました。

今回はImageNetについて解説します。


Fei-Fei Liによって発案

ImageNetを立ち上げたのは、Fei-Fei Li(フェイフェイ・リ)です。中国生まれで、16歳(15歳というもある)でアメリカに移住し、物理学やコンピュータサイエンスなどをプリンストン大学で学びました。その後、カルフォルニア工科大学で電気工学の博士号を取得しています。

そのフェイフェイ・リは、2006年にImageNetを思いつきます。その頃は、イリノイ大学のアーバナ・シャンペーン校で電気・情報工学科の助教授として勤務していました。その当時の彼女の研究は、AIのモデルやアルゴリズムにフォーカスしていました。しかし、AIモデルを訓練するためのデータをもっと豊富にしたいと考えていました。しかし、すぐには画像データを集めることはありませんでした。

2007年からは、プリンストン大学でコンピュータサイエンス学科の助教授に就任します。そして2009年にはスタンフォード大学で助教授になります。おそらく、とても忙しい毎日を過ごしており、まだImageNetのことに集中することはできなかったのかもしれません。

しかし、その活動は2008年から始まります。

アマゾンのメカニカルターク

2008年の7月には、まだImageNetには一つも画像がありませんでしたが、同じ年の12月までには、300万画像が集まりました。そして、2010年の4月までに1100万画像を含むまでになりました。

これらの画像には正解データも含まれています。例えば、画像分類の画像ならそれが何の物体なのかといったラベル情報が付随してはじめてAIの訓練に使えるデータセットになるからです。

歯科ひs、そんなにたくさんの画像をたった2年弱の間に、どのようにして集めたのでしょうか。

実は、アマゾンのメカニカルターク(Mechanical Turk)というサービスを使いました。要するにたくさんの人を雇って膨大な数のインターネット画像を収集し、画像に関連情報を注釈付けしたりラベルを付けました。

結果として、そのようなサービスがない時代では考えられないような数のラベル付き画像の大規模なデータセットを効率的に収集することができました。このように大量のラベル付き画像を集められたことは、コンピューター ビジョンの分野における高度な機械学習アルゴリズムの開発とトレーニングにとって非常に重要な出来事でした。

ディープラーニング流行のきっかけ

そして2010年に、ImageNetの画像データセットを使った初めてのコンペを開催しました。これを ILSVRC(ImageNet Large Scale Visual Recognition Challenge)と呼びます。たくさんの研究チームが参加してその成果を競いました。

初期のコンペでは、伝統的なコンピュータビジョンの技術が主に使われていましたが、2012年に畳み込みニューラルネットワークである AlexNet が優勝しディープラーニングに注目が集まります。それ以後のコンペでは、ディープラーニングを使ったモデルがたくさん登場するきっかけとなりました。

その後のILSVRCの開催は、次から次へと記録を伸ばす新しいモデルの登場で大いに盛り上がりました。画像分類や物体検出などの発展の歴史に大いに貢献しました。

2012年からの画像分類部門での優勝モデルは以下になります。

  • 2012年:AlexNet(トロント大学 SuperVision)

  • 2013年:ZFNet(ニューヨーク大学)

  • 2014年:GoogLeNet(Google)

  • 2015年:ResNet(Microsoft Research)

  • 2016年:Trimps-Soushen(公安部三所)

  • 2017年:SENet(Oxford大学、中国科学院)

優勝こそしなかったもの、2014年のVGG-16(Oxford大学)、2016年のResNeXt(カリフォルニア大学、Facebook AI Research)、2017年のMobileNet(Google)なども有名です。

ImageNetのコンペに参加したモデルの構造などは論文などでオープンにされており、お互いに刺激となって毎年性能が向上していきました。ImageNetのおかげで分類AIはかなり進歩が進んだと言っても過言ではないでしょう。

しかし、終わりはやってきます。

ILSVRCの終わり

ILSVRCは2017年で終了します。主な理由は、すでに人間を超える精度を達成しており、また精度の上がり具合も天井に達しているためこれ以上は大幅な向上は見られないためです。ILSVRCはディープラーニングの世界に大きな貢献をし、その役割を十分に果たしたと言えます。

そして、フェイフェイ・リは、2018年にはスタンフォード大学で教授となります。

フェイフェイ・リの生徒として有名なのは、Andrej Karpathy(アンドレイ・カルパシー)です。彼は有名な畳み込みニューラルネットワークの講義をしました。卒業後の彼はOpenAIの創設時に研究者として参加し、テスラのAIを担当する上級ディレクターになり、今年2023年にまたOpenAIに戻ってきました。

それにしても優秀な人は大リーガのようにあちこち移籍するものですね。(個人の感想です)

やがてフェイフェイ・リは、スタンフォード大学の人工知能研究所の所長になったり、グーグルのAIと機械学習のチーフサイエンティストに就任したりしています。これまた、すごい経歴の持ち主です。

次回予告

次回は、AlexNetの解説をします。

お楽しみに!

ここから先は

0字

キカベン・読み放題

¥1,000 / 月
初月無料
このメンバーシップの詳細

この記事が気に入ったらチップで応援してみませんか?