日本流、AI活用。フィジカル産業に未来をもたらす「画像認識」の可能性。

和田崇（㍿Laboro.AI　執行役員／マーケティングディレクター／経営学修士）

2020年2月9日 14:34

AIがまるで人の目のようにモノを認識するー、ビジネス現場でもこうした事例を多く見聞きするようになってきましたが、実際、AIによってどの程度のことが可能になってきているのでしょうか。

みなさん、こんにちは。(株)Laboro.AI 和田です。AI（人工知能）について、できるだけわかりやすくお伝えすることを目指したコラム、３回目です。今回は、先日のコラム（こちら）でAIができることとしてご紹介した「認識」のうち、「画像を認識する」ということについて、その概要と可能性について考えてみたいと思います。

現在、AIを活用した領域の中でもとくにめざましい進歩を遂げ、ビジネスでの実用化例も多く見られるようになったのが、この画像をデータとしたAIの活用分野です。

この始まりになったとも言えるのが、2012年、ILSVRC（Imagenet Large Scale Visial Challenge：ダサくなることはわかりつつ、あえて日本語訳してしまうと「大量データからの画像認識チャレンジ！」）という国際的なコンペティションでのことでした。当時のILSVRCで競われたのは「画像の中に何が写っているか？」をAIに答えさせる「物体識別」というもので、参加チームのそれぞれは、あらかじめ決められた約100万枚の画像を覚えさせたAIモデルを事前に用意した上、それとは異なる約10万枚の画像を見せたときに正しく写っているものを回答できるか、その精度が競われました。

2010年から始まったILSVRCでしたが、2011年の時点ですでに技術的には成熟しており、各チーム間の争いは１〜２％の僅差で繰り広げられていました。ところが、2012年、米トロント大学が開発したAIモデルが、他チームに10％もの違いを付けて優勝するという快挙を成し遂げ、世界中のAI研究者を驚かせました。例えるならオリンピックの陸上100m走、0.1秒の差を各ランナーが争っている中、1秒もの大差をつけて圧勝する選手が現れたような歴史的な出来事だったと言えます。

ここで用いられたAIモデルには、それまでの考え方とは全く異なるアプローチの技術が用いられていました。それが、今ではよく聞かれるようになった「ディープラーニング（深層学習）」です。これをきっかけに翌年以降のILSVRCでは、ほぼすべての参加チームがディープラーニングを採用、2015年には人間の認識率を超えるまでにAIの画像認識技術は進歩しました。

ディープラーニングは、このILSVRCで日の目を浴びることになりましたが、現在では画像分野だけでなく、文字情報を扱う自然言語分野、音声分野など、あらゆるAIの技術領域で用いられており、AI（人工知能）の進化と普及に大きな影響をもたらしました。

----------
＊画像技術分野の詳細としては、物体識別、物体検出、物体位置特定など様々な領域がありますが、このコラムでは分かりやすさを優先するため、AIによる画像技術分野の総称として「画像認識」という言葉を用いています。
----------

AIによる画像認識は様々なシーンで活用されています。例を挙げるとキリがないほどその活用は様々な業界で進んでいますが、その背景として一つ言えることは、AIはIT・ICTと異なり大規模なシステム環境がなくても力を発揮できるということがあります。

よくAIとIT・ICTは混同して語られたり、IT・ICTが進化したものがAIだと思われることがあります。確かにデータを活用して演算処理を施すという点では同じですが、これらは異なる進化を辿ってものと捉えた方がAI活用の視野が広がってくるはずです。

日本ではIT（Information Technology）という用語が用いられますが、海外ではICT（Information and Communication Technology）と呼ばれるのが一般的です。これを日本語にすると情報通信技術、つまりIT・ICTは、データとして収集された情報をどう通信・流通させるかを主に据えた技術だと言えます。そのため、設備としてデータを蓄積するためのサーバーや通信設備など、投資的にも物理的にも大掛かりな環境が必要となります。

一方AIは、これまでのコラムで見てきたように情報そのものを処理するアルゴリズム（計算式）ですので、データさえあれば大掛かりなシステムは必要ありません。カメラ１台あれば画像データを取得することもできますので、実は比較的手軽に導入できるのがAIの特徴です。（もちろん、大容量のデータを処理したい場合はそれなりの設備が必要にはなりますし、結果情報として流通させたいとなるとICT環境は欠かせません。）

こうした違いもあり、昨今、AIの導入が盛んになっているのが製造業や建設業、インフラ、農業などです。大掛かりなシステムを構築しやすい環境にあったEC、小売、オフィス環境などの分野がICTの恩恵を受けてきたのに対して、これまでICT技術が入り込めなかったフィジカル（物理的）な業界がAIの恩恵を受け始めているというわけです。例えば、

・製造現場で作業者の動きを認識し、安全管理やノウハウ共有に役立てる
・建設現場にある機械を認識し、正常に動いているかリアルタイムに監視する
・橋など建造物の劣化箇所を認識し、安全管理を進める
・農園にある農作物の成熟度の認識し、収穫予測を行う

などはその一例です。

よく「IT環境が整っていないとAIは導入できない」と思われがちですが、この誤解に囚われてしまうとAIの普及・活用の機会を棒に振ってしまうかもしれません。とくに今回ご紹介の画像認識の分野は、非常に多くのシーンでの可能性を持っている技術です。

というのも、日本の産業は、ご認識の通り、製造業や一次産業を始めとしたフィジカルな産業が諸外国に比べても優れており、御家芸とも呼べる匠の技術、その正確性、品質、スピードなど、多方面で優れた実績があり、日本の経済成長の一役を担ってきました。伝統的に培われたノウハウが多く存在する国内産業は、その分、AIの活用可能性が期待できる領域がそれだけ多く存在していることを意味します。一見すると、AIの研究が盛んなアメリカや中国がAIに関連する将来性があるようにも言われますが、AIを産業やビジネスに応用するという点においては、実は国内産業には多くのチャンスがあると捉えることができます。

さて今回は、AIが得意とする「認識」のうち、画像認識についてその歴史と現状、将来性を簡単にお伝えさせて頂きました。次回は、もう一つのAIの得意分野「予測」について考えてみたいと思います。

今回もありがとうございました。

---ここから下は、私が勤めるLaboro.AIのご紹介です----------

(株)Laboro.AIについて

オーダーメイドのAIソリューション「カスタムAI」の開発・提供を事業とする、AIスタートアップ企業です。アカデミア（学術分野）で研究される最先端のAI・機械学習技術のビジネスへの実用化をミッションに、業界に隔たりなく、様々な企業のコアビジネスの改革を支援しており、その専門性から支持を得る国内有数のAIスペシャリスト集団です。

Laboro.AI　WEBサイト

----------------------------------------

＊本文掲載の画像は当社制作もしくはflickrから引用したイメージです。

この記事が気に入ったらサポートをしてみませんか？