
もっと楽しくはじめたい! これからのAI・データサイエンスの学び方
「株式会社ヒューマノーム研究所」代表取締役社長の瀬々です。
今回は、AIやデータ解析が広がっていくためには不可欠な「AI入門」のあり方についてお話させていただきます。AIの世界へ、ものづくりの様な楽しさから入門できる環境について考えます。
なお、本稿ではデータサイエンス・データ解析とAIはほぼ同義です。AIをデータサイエンスと読み替えて頂いても構いません。
AI入門は「技術より」でも「経営より」でも難しい
AIの普及とともに、たくさんのAI入門書・入門講座が企画されています。内容は大きくわけて2種類。
1つは開発者・研究者向けで、比較的技術寄り。もう1つはビジネスマン・経営層向けで、AIの歴史や概論、社会的影響に寄せた内容です。
前者に初心者がチャレンジした場合、AI構築にたどりつくまでに、長い道のりが待ち構えます。後者は、AI構築の「雰囲気」だけ学び、実際には手を動かしません。表面だけ理解した状態で開発に関わった結果、現場でAIエンジニアと揉めてしまった、という話をちらほらと聞きます。
下記にAI学習の流れを示します。大きく「理論を知る」「プログラミング」「モデル構築」「モデル利用」「課題設定」の5段階があります。

エンジニア向けのAI入門教材は、基礎を重視する場合は理論から、より実践的な場合は、理論を軽くしてプログラミングからはじめるものが多いようです。
とはいえ、前回お話したとおり、プログラミングは人により得手不得手があります。新しくできたAI・DX関連部署へ異動した方が、実技重視の講座を受けた場合、AI構築までがあまりに遠く、心が折れる可能性は否定できません。
逆に、ビジネスマン向けの教材では、現代AIの歴史や思想、導入の注意点を中心に、AIによってビジネスが変革する過程を学べます。AIを作る場合は、この後、先述の技術者向け教材に取り組むこととなります。
技術者向け教材は多くの場合、なんらかのプログラミング経験者向けの内容です。とはいえ、ほとんどの方はプログラミングも機械学習の数式も知りません。当然「何からはじめたらいいの?」という質問が続出します。
どうしてAI学習に行き詰まってしまうのだろう

確かに、AI構築を完全に理解するには高いハードルがあります。プログラミングスキル、データサイエンスの知識、結果の評価方法など、様々な知見が求められるためです。これらが絡まり合い、AIの学習が目的化してしまったように感じます。
そもそも、AI・DXはデータを活用した新しい世界を作り出すための手段のひとつです。
それなのに、データを見て、触って、楽しむ、というAI構築が本来もつ楽しさへ到達する前に学習に行き詰まってしまう。これがデータサイエンティストの育成が難しいと言われる原因ではないか?と懸念していました。そして、お客様と会話する中で、その懸念は確信に変わりました。
初心者向けAI教材に欠けているもの
例えばギターをひこう!と思い立ったら、次に何をするでしょうか。ギターを木から切り出して作る、和音などの音楽理論を学ぶ、というところからはおそらくスタートしないでしょう。
適当に弦をさわったら音が出た!というワクワクからスタートし、もっと素敵な演奏や、かっこいい曲づくりに向けて音楽理論を学ぶ、と進むのではないでしょうか。AI構築も同じです。モデルの構築やデータ解析には、楽器を演奏したり、作曲するような楽しさがあります。
私は、AIにはこの楽しさを伝える入門講座と、例えばiPhoneに標準搭載されている楽曲制作アプリ「Garageband」のような、気軽に使えてプロユースもできるような入門ツールが欠けているのでは?と考えました。

AI開発って何が楽しいの?
AIの開発には、ゲームのように予測精度を高める技術的な楽しさと、AIで変わる世界を想像する楽しさがあります。
一例としてKaggleというサイトをご紹介します。企業や政府が出した問題を解決する、より高精度の解析モデルを作るべく、世界中の機械学習・データサイエンスに関わる人が集まり、競います。
Kaggle同様、AI構築には、計算式・プログラムを組み上げるだけではなく、作ったAIを実際のデータで試し、精度を確認する行程があります。この「データを集めてモデルを構築して、また試す」という繰り返しこそがAI独特の楽しさです。
AIは、その本質ゆえに生まれる楽しさと難しさを併せ持ちます
理論を学び、プログラムができてもAI開発は終わりません。データを集め、集めたデータに情報タグをつけ(アノテーション)、データと作成目的に合わせたモデルを選び、機械学習アルゴリズムを設定する(パラメータチューニング・ハイパーパラメータチューニング)、といった作業が続きます。


データ収集以降のステップは、これまでのITプロジェクト開発には存在しません。この方法は馴染みが薄い上、AI開発が抱える「不確実性」が影響し、一般的なソフトウェア開発で使われる「課題を分割して解決する」開発方法(ウォーターフォール型)がうまく合いません。
この点が、経営者的な視点からAI構築に関わった方が困惑する点です。人数を増やしてもプロジェクトは進まず、時間を伸ばしても必ず良い結果となるとは限らないのです。
この「不確実性」がAIの開発手法の抱える本質です。
しかし、データ解析側としては、ここがもっとも楽しい試行錯誤の時間だったりします。あーでもない、こーでもない、などと話しながら、より良いモデル、より良い解釈を目指して磨き続けます。芸術作品を作っていくようなイメージです。

高校生がAIづくりの楽しさを証明してくれた
一番ワクワクするモデル作成からはじめたら、AI構築やデータ解析の楽しさや難しさを知った上で、プログラミングやビジネス構築に流れる、というAI入門システムを作れるのでは?
そんな風に考えた当社は、わかりやすく、応用範囲の広い画像・動画と、表データ(エクセルデータ)を対象に、モデルを作るところからはじまる初心者向けツールの開発をはじめました。
Humanome Eyesは、トライアルを高校生にお願いしました。彼らは1時間ほどのチュートリアルで操作をマスターし、その3ヶ月後行われた高校生向け学会で発表された Eyesを活用した生物学研究の成果は入賞を果たしました。
AIとは縁遠かった高校生がAIを使い、私達の考える「これからのAI教育と研究スタイル」を体現してくれました。非常にうれしかったです。
AIがもたらす新しいパラダイム
一般にAIは、計算工学・計算機科学の一分野とみなされます。しかしながら、AIを活用することを考えた場合、計算工学的な視点だけではなく、データ収集・活用の問題や、完成後に待ち構えるビジネスの問題など、単なる手段にはとどまらない面まで視野を広げる必要があります。
今のAIには、研究面でもビジネス面でも計算技術・応用・データを総合的に判断し、さまざまな分野を横断する新しいパラダイム(この時代で規範となる物の見方や捉え方)が求められていると感じます。
次の記事では、「実際に作ってみた」から始まるデータ解析の流れを解説しながら、新しいAI入門の形をご紹介します。
次の記事はこちら
AI・DX・データサイエンスについてのご質問・共同研究等についてはお気軽にお問い合わせ下さい。