AI時代へ向けて育成すべきはAI人材か?

今年3月に政府のAI戦略が年間25万人を目標にAI人材を育てるとぶち上げたのに続いて、教育再生会議が全ての大学生がAIなどの基礎的な素養を身につけられるように標準カリキュラムを作成することを提言した。ガートナーが2017年1月に産業界で2020年末時点で30万人以上のIT人材(原典を確認したところAI人材ではなかったようですね)が不足するといったらしいのだが、今からカリキュラムをいじったところで2030年くらいにならないとAIネイティブな新入社員は入ってこないし、その頃まで深層学習が流行っているのか、NVidiaが残ってるのか、PythonやTensorFlowが広く使われているのか、GAFAがどうなっているかなんてさっぱり見当がつかない。

残念ながら私たちは2010年代に深層学習の実用化の局面で米国に負けたのであって、いまから教育をいじるといったって泥棒を捕らえて縄を綯うような話である。どんなに政府がイキったところで、教えられる教員が急に増える訳でもなく、中途半端な理解の教員がにわか勉強のデータサイエンス教育を学生に披瀝したところで、データサイエンス嫌いを量産することになりかねない。最近も久々に寄った文壇バーの学生店員さん(理系学部ではない)から私がIT関係と知るや「RとかPythonが大嫌いなんですけど、何であんなの急に教えるようになったんですか」と話しかけられて、AI教育のビッグウェーブが現に学生たちのキャンパスライフを変えているんだな、にわか仕立てのAI教育を教える方も受ける方もかわいそうだと同情を禁じ得なかった。

AI教育のビッグウェーブついでに、中等教育に行列やらベクトル、統計といった内容が復活することは必ずしも悪いことじゃなさそうな気がするけれども、正確な情報がなければ不正確な分析結果しか出てこない(これを計算機科学屋さんたちはgarbage in, garbage outと呼ぶ)訳で、タイミングの悪い話ではあるが統計不正を何とかすることの方がずっと重要である。そして政府統計を扱っているのは今のところRでもPythonでもなくCOBOLであって、報道によると孤独な職員がテストも何もやらずにソースコードを弄っているらしい。統計は過去との一貫性が大事だから、そうそうモダンな環境でリファクタリングする訳にもいかない。そんなところに10年後、中学から「AI教育」を受けて大学ではKaggleで鳴らしたピッカピカのデータサイエンティストが入省して、COBOLの文法から学んで仕様書のないスパゲッティコードを前に絶望することになれば、全くもって笑い話では済まされない。

AI研究者を集めて有識者会議をやる、日本は欧米と比べてデータサイエンティストが少ない、論文数が少ない、トップカンファレンスでの発表が少ない、このままでは中国に負けてしまう、そういった危機感は残念ながら現実なのだろう。じゃあそれが中等教育や大学教育の問題かというと疑わしい。ちょっと調べれば分かることだが日本の中等教育における数学のレベルはかなり高い。平均レベルでいえば米国よりもずっと高い。そんなことはデータに当たれば、すぐに分かる話である。

仮に米国をベンチマークとして、やるべきことがあるとすれば、国民全員に広くデータサイエンス・リテラシーをつけさせることではなく、突出した人材に対して追加の数学教育を受けさせ、海外から高度人材をもっと受け入れ、データをぶん回せる若手ポストを増やすことだろう。足りないのは若者のAIリテラシーではなく、大量のデータや潤沢な計算機リソースにアクセスでき、論文を書く時間や海外のカンファレンスに行って発表する余裕がある環境である。ぽんぽん科研費を積まれたところで、若手研究者が書類仕事や学務・雑用に忙殺されては意味がないのである。せっかく数学を身につけたところで活かせる場所がなければ意味がない。GAFAはじめとしてデータサイエンスは典型的な設備産業だから頭数と竹槍では勝てない。魅力的な仕事がなければ、育った人材がスキルを活かす機会もなく、海外から優秀な人材が来るはずもない。GAFAの人材供給源として草刈場になるばかりだろう。

AIで日本が米国に負けたのは、平均的な国民の数学リテラシーが低いからではなく、日本企業が消費者向けIT産業で総崩れしてしまってデータを集められず、データを分析する環境に投資できず、データサイエンスを実践できる場がなかったからである。余裕がないから基礎研究は縮小し、ニーズがないから技術も育たなかった。ようやく2010年代半ばから米国でオープン化されたソフトやインフラのおこぼれで研究が進むようになったが、まだまだ米中よりも出遅れている。

日本人がAIで腕を振るうために米中のアカポスに就いたりGAFAに就職する姿を随分と見てきた。ようやく日本企業もデータサイエンティストを雇ってアレコレやってますという話を色々と聞くようにはなったものの、よくよく話を聞いてみると前から使っていたSASやらSPSSでゴニョゴニョ弄っているだけという話が多い。それでもExcelマクロよりは随分とマシかも知れず、そもそも基幹系システムに積まれている大して大きくもないデータを分析するだけであれば、それで十分という話もある。

太平洋戦争の時と同じように、私たちは兵站で米国に負けたのである。別に教育やら精神で負けたのではない。AIは設備産業であって、クラウドインフラ、チップ、巨大なシステムを維持更新するためのプロジェクト管理やソフトウェア工学をはじめとして、データが集まるビジネスモデルや広告をはじめとしたエコシステムと収益構造、プライバシーとデータ流通を支える法制度や法務渉外スタッフなど、様々な分野の専門知を結集した総力戦である。データサイエンティストとは、そういった膨大な手足によって支えられた一握りの作戦参謀のような役割ではないか。どんなに優秀な作戦参謀を育てたところで、訓練された兵士と武器、兵站がなければ戦争には勝てない。

ガートナーの推計根拠はよく分からないけれど、日本企業に欠けているのはデータサイエンティスト以前に、事業のデジタル化を通じてデータ分析の結果を収益に繋げられるサービスを構想し、システムを刷新してデータを分析できる環境をつくることであって、いま仮に天恵によってよく訓練された若手データサイエンティスト30万人が東京湾に漂着したところで、日本企業に入ろうにも官僚的な組織とレガシーシステムに閉じ込められた大きくもないデータ、大量のExcel仕様書とコピペだらけのスパゲッティコードを前に途方に暮れて、GAFAに履歴書を送るようになることは目に見えている。

もちろんこれからの社会にとってAIが重要であることは論を俟たない。しかしながら日本に欠けているのはデータサイエンティストの総数ではなく、データを活用できる環境そのものである。それをつくるために必要なのは数十万人のデータサイエンティストではなく、年齢や権限に関係なく官僚主義を排してオープンに議論できる環境であり、20世紀の遺産に縋ることなく新たに情報化投資を行う企業の財務余力であり、データを収集、活用、収益化できるデジタル事業であり、それを支えるシステムを構築するために必要な現代的なソフトウェア工学、アジャイル型のプロジェクト管理、オーバーヘッドの小さな仕様と品質の管理、働きながら学び続けられる環境、こうしたスキルの人的資本蓄積に対して企業が投資し続けられる産業構造である。

国が企業に社会福祉や雇用維持の責任を押し付け、その制約の中で企業が多重下請け構造のもと、スキルの低いエンジニアのレベルに合わせて旧態依然としたシステム開発を続けているままでは、いくら優秀なデータサイエンティストを育てたところで、GAFAや米国・アジアのスタートアップの草刈場になるばかりではないか。データサイエンティストを育てる以前に、データがあってもデータに基づいて正しい意志決定ができない社会構造から改める必要がある。これから世に出てくるAIネイティブの若者たちを絶望させないために残された時間はあまりにも少ない。

いいなと思ったら応援しよう!