分類AIの進化史⑫MobileNet
前回は、2017年のILSVRCの画像分類部門で優勝したSENetの解説をしました。この年でImageNetのコンペティションは終ったのですが、他の参加モデルで言及に値するものがいくつかあります。その中から、今回は、2017年のILSVRCに参加したGoogleのチームによるMobileNet(モバイルネット)を紹介します。
これまでずっと、どちらかと言えば精度の高さが強調されてきました。そのため、ネットワークの層の数(深さ)や、畳み込み層のチャンネル数(幅)を増加させてきました。さらに、カーディナリティやSEブロックなどを導入して複雑性を加えました。こうして人間の能力を超える精度が達成されましたが、いくつか実用性の面で課題がありました。
例えば、モバイルや組み込みシステムでは、精度の高さや推論の速度に加えて、メモリ使用量やエネルギー消費量が重要となってきます。これまでのモデルでも、ある程度の配慮はなされてはきましたが、それでも想定される環境はGPUをガンガン使えるコンピュータでした。
そこで、Googleは、スマホやロボットの内部で使える効率性を第一の目的としたMobileNetの開発を行いました。そのためメモリや電力消費量を抑えられる軽量で高速なモデルが開発されました。
ただ軽快に動作するだけでなく、十分な精度を保つ必要があるのがチャレンジとなっています。Googleはどのようなアプローチを選んだのでしょうか。
この記事では、MobileNetの仕組みを解説します。
この記事が気に入ったらサポートをしてみませんか?