目指しているエコシステム(その1)
前回のnoteでは、現在のAIブームのきっかけがコンペティションであり、産業界にどのように普及していったかを解説した。2013年に日本で初めてコンペサービスを立ち上げて以降、国内外を取り巻く社会情勢の変化と関連した様々な社会要請から、僕たちが担うべき役割が見えてきた。むこう3年以内に実現を目指している状態は以下である。
具体的には、AI社会に移行する中で、3つの立場における困りごとを同時に解決するエコシステムの構築を理想としている。
まずは、「その1」として、企業の視点で考えてみたい。
企業の困りごとを解決
いつの世も新しい技術を活用するフェーズでは、社内に知見のある人材はいないし、外部に依頼しようにも適切なパートナー見つけることは難しい。だからといって手を拱いていると競争力を失ってしまう。まさに、今のAIがそのステージだ。そんな状況で抜群の威力を発揮するのがコンペティションである。課題とデータを公開することで世界中の優秀な技術者との接点を作り、競争の中で現時点で最も優れたAIを生み出すことができる。社内に潤沢なリソースと知見がない企業であっても、外部から優れたAIを買い取ることで有用な知見を手にいれることができる。おおよそ、AIの精度追求においては、コンペよりも投資対効果の高い方法はないであろう。一般に、機械学習のアルゴリズムは多数存在し、特徴設計やパラメータチューニングのパターンも莫大な組み合わせが考えられるため、AIのモデリングフェーズは「労多くして益少なし」である。事実、あらゆる問題で性能の良い万能なアルゴリズムは存在しない(ノーフリーランチ定理)。よって、問題に特化したモデルを作り込まなければならない。つまり試行錯誤の量がAIの性能を決める。また、多人数で1つのテーマに向き合うことにより、精度限界の推定が可能になることもコンペの利点だ。多くのAIプロジェクトにおいて期待する性能を実現できるかどうかの検証(PoC: Proof of Concept)を行うことが多いが、実際にはその見極めはとても難しい。たまたま担当した技術者(社内、ベンダー問わず)が実力不足であった場合、プロジェクト自体の評価が低く見積もられてしまう。別の優秀な技術者が担当していれば成功していたかもしれないのだ。これは、世にいう「PoC貧乏」(PoCを繰り返しいつまでたっても実用化されないこと)を招く一因となる。一方、コンペでは、競い合う事でAIモデルの精度が改善されていくが、時間の経過とともに改善が難しくなっていき、いずれ限界に達する。おおよそ現状の技術では、特別な研究のブレークスルーがない限り、どんな専門家であったとしても、この精度限界を大きく上回ることは期待できない。いわゆるSOTA(state-of-the-art)なモデルだ。これはプロジェクトの意思決定者にとって貴重な情報となる。仮にSOTAが実務的に十分とはいえない性能水準であったとしても、早期に戦略を変更することで、余計なコストを垂れ流さずに済む。
2018年、JR西日本はデータ活用のプロジェクトを立ち上げようとしていた。この先、日本では労働力人口の減少は避けられない。ライフラインである鉄道事業を高い安全水準で運用・維持していくためには、データやAI活用によるスマート化が必至だ。しかし、当時の実態としては、日本中のほとんどの大企業において、データ活用の知見がある状態とは言い難かったと思う。そんな社会背景から、文科省は「データ関連人材育成プログラム」を予算化し、産学連携の実践教育プロジェクトを開始した。関西地区では、大阪大学が選定機関の1つであった。僕たちは先立って日本初のデータサイエンス学部を設置した滋賀大学と連携協定を結んでおり、滋賀大経由で関西地区のコンソーシアムに参画することになった。コンソのキックオフイベントでは、参画大学と企業が一堂に会し、高名な教授陣から予定している活動に関する説明がなされた。(民間では唯一)僕もプレゼン枠をいただき、コンペの紹介と産学のブリッジが可能ですよという話をした。そこで、JR西日本の宮崎課長と出会い、意気投合、結果、コンペを開催することになる。JR西日本内部におけるコンペ開催までの道のりや成果については以下の記事が詳しい。
コンペの内容は、「北陸新幹線の車台への着雪量予測」である。北陸地方は日本でも有数の豪雪地帯だ。新幹線は屋外を走行するため、当然、車体に雪がつく。高速走行時に車台についた雪が落下し、地面にぶつかると激しく飛散する可能性がある。よって、安全上の観点から一定量の着雪がみられた場合、除雪を行うルールとなっている。しかし、実際には気象条件により着雪量はまちまちであり、不必要な除雪員の稼働が発生していた。そこで、データに基づく着雪量予測アルゴリズムを開発し、除雪員配置を最適化しようと考えた。約2ヶ月間のコンペに対し、473人が参加し2115モデルが投稿され、高い予測精度が達成された。得られた上位3つのモデルは、SIGNATEが提供しているAI運用クラウドサービス上にインストールされ、2019年から現場の意思決定に利用されている。予測精度は以前よりも大幅に上がり、関連コストの削減につながっている。さらに、毎年の着雪実績を再学習させることで、さらなる精度改善を追い続けている。また、興味深いことに、このコンペでは「才能の発掘」という成果を同時に得ることができた。実は、JR西日本の社員および複数のデータ分析支援ベンダがコンペに参加していたのだ。成果はめざましく、JR西日本の若手社員2名が10位以内に入賞するという快挙を達成した。なんと、一人は新幹線の運転士、もう一人は自動改札機のメンテナンス部署所属である!現在、彼らは宮崎課長の部署に異動になり、コアメンバーとしてバリバリ活躍している。AI人材の話は後述するが、大企業には、実務でAIと無縁の部署に秘めたる才能の持ち主が埋もれているのではないか?というのが僕の見解だ。通常業務では、そのような人物を発掘するのは不可能であろう。データ分析ベンダからは大手・中堅からベンチャーまで複数社参加した結果、1社のAIベンチャー(株式会社ギックス)が好成績を納めた。JR西日本は、そのエビデンスを持ってして、グループ内のCVC経由でギックスと資本業務提携を行なった。今ではギックスの支援を受けながら様々なデータ活用プロジェクトを推進している。このように、内部に知見の少ないフェーズであっても、コンペをうまく活用することで、AIプロジェクトの成功体験を蓄積し、自立したデータ活用組織の構築が可能になるのである。
ちなみに、コンペが有用なのは、知見の少ない企業だけではなく、高度な技術を有する研究機関や技術組織においても同様だ。社内に専門技術組織があるのに、モデリング業務を外注することは、本来やるべき仕事を放棄しているのではないか?という声を聞くことがある。しかし、社内で1から試行錯誤を繰り返すよりも、外部のベストプラクティスを得てから、より高度なモデルを追求する方が効率的なのは明らかである。内部で開発済みのAIもコンペを活用することで、さらなる精度向上が期待できるし、常に最新のノウハウを得ることができる。SIGNATEでは、過去様々な産業領域において、事業部や経営企画などの技術的リソースを持たない組織だけではなく、大企業研究所や国立研究機関など高い技術力を誇る組織ともコンペを開催してきた。
国立研究開発法人海洋研究開発機構(JAMSTEC)は海洋・気候研究において世界トップレベルの研究所だ。世界第2位(ちなみに1位は中国)の潜水深度記録を持つ有人潜水調査船「しんかい6500」が比較的馴染み深いかもしれない。昔、「しょこたん」が深海生物を求めて同機に乗り込み、5200mまで潜るというエクストリームなTV番組をみたことがある(本人談)。また、地球規模の気候変動のシミュレーションを目的とした「地球シミュレータ」を開発するなど、かつては世界のスーパーコンピュータ研究をリードしてきた(2002年〜2004年まで世界No.1)経緯がある。そんなJAMSTECは、2018年にSIGNATEにおいて「台風の検出アルゴリズム」をテーマとしたコンペを開催した(きっかけはNVIDIAさんのご紹介でした!感謝です)。
ここ数年、大型台風が日本を直撃し甚大な被害をもたらしている。自然災害なので、僕たちとしては、覚悟して備えておくことぐらいしかできない。その意味でも、台風の発生をなるべく早く捉えることは有用だ。ところが、発生前の台風(熱帯低気圧のタマゴ)を正しく識別することは、気象の専門家であっても難しいのが実態だ。この問題に対し、JAMSTECでは、従前から地球全体の雲の動きをシミュレーション可能なアルゴリズム「雲解像気象モデルNICAM」を開発し研究を進めてきた。2011年に世界No.1の性能を達成したスーパーコンピュータ「京」を用い、NICAMにより生成された20年分の雲画像データを活用、DeepLearningよる台風早期検知を九州大学との共同研究により実施し、優れた研究成果を発表している。
同時期に開催されたコンペでは654人が参加し、3293モデルが提出された。結果として、研究論文とおおよそ同水準のモデルに対して約40%の精度改善を達成した(Recall0.79以上でPrecisionを0.26から0.66まで上げた)。コンペ終了後、成果発表会を開催し知見の共有と技術者のネットワーキングが行われた。まさに、オープンサイエンスである。研究能力とモデリング能力は一致しないし、する必要もない。最も有能な研究者の役割は、優れたパラダイムを投げかけ、研究テーマの設計とPoCを示すことであり、高度化や実用化は別の誰かがやればいいのだ(その部分はより得意な人がいる)。
以上の例のようにSIGNATEで開催されたコンペでは、ほとんどのプロジェクトにおいて、得られた成果物を研究開発や業務改善に活用することで実質的な成果が出ている。これらの結果から
「高い投資対効果でAIの知見を調達するシステム」は既に実現できている。(図右下「分析結果」のフロー)
このエコシステムをもっと活用すれば、企業活動や研究活動におけるAI導入の機会損失を今よりも減らすことができるはずだ。
もう1つ、AIに関して企業が抱えている喫緊の課題は、人材の確保である。これからの時代に必要な人材については、以前「AI人材とは?」にて解説した。これからの社会では、あらゆる組織に「わんさか」AI人材が必要なのだ。時代の趨勢か、最近ではAI人材の大量採用を標榜する企業も増えてきた。しかし、現実はそんなに単純な話ではない。実際、この手の人材採用に苦労しない企業は、日本では数えるほどしか存在しない。理由は多数考えられる。そもそもAI人材の絶対数が少ない。奪い合いなのだ。よって給与が高騰する。そのような特別扱いはできない企業も多い。終身雇用を前提としているため、そもそも受け皿が無い企業もあるだろう。しかし、もっと本質的な問題がある。それは「ミスマッチ」だ。企業側は、どのような人材を採用したいのか?採用後はどのような仕事に従事してもらうのか?その結果、どのくらいの経営インパクトを期待するのか?そこから試算される妥当なオファー額は?これらの具体性が乏しいのが実態だ。転職活動中の技術者から、こんな話しをよく聞く。「実際に入社してみたら、仕事の内容が想定と全く違っていた。データも無いし、技術的な仕事がほとんど無かった。」これはいただけない。学生も同様にAI人材やデータサイエンティストとしての就職にためらいがあるようだ(2019年マイナビ AI推進社会におけるキャリア観に関するアンケートより)。学生の75.4%がAI・IT職を志望しないと回答し、
といった声があがる。
ただし、採用企業側の悩みもわからないでは無い。AI人材といっても、どのようなスキルがあるのか?レベル感もよくわからない。そもそも、どんな人物像が理想なのかさえわからない。理想があっても能力を客観的に判断する方法が無い。つまりAI人材の能力定義とスキルレベルもまた具体性に欠けている。これもよくある話だが、職務経歴書をみると「ピカピカ」なキャリアでいかにもAIスキルが高そうだが、採用してみると評論家なだけで実行を伴わない。これもまたいただけない。つまりは、双方ともに具体性が低いことがミスマッチを起こす最大の要因と考える。それでも、コンサルティングファームやAI受託開発ベンダなど、幅広い企業を支援する立場の企業は、事業会社に比べるとAI人材を採用しやすいようだ。なぜなら、求職側にとって業務内容(技術をどのように使うか)がイメージしやすく、求人側も人月商売なので採用=売上であり、売り手市場では高い給与を払っても十分ペイするからだ。事実、日本では、AIを含むITスキルを持つ人材の約70%が支援ベンダー側で働いている。あるべき姿として国は、これを欧州並の50%まで引き下げるシナリオを提言している(DXレポート ~ITシステム「2025年の崖」克服とDXの本格的な展開~)。支援側の立場では事業理解が限定的だし、業務改善しようにも業務プロセスへの介入に限界があるからだ。つまりは、自分ごととして成果につなげていくには、事業会社にAI人材が潤沢に存在しなければならない。
僕たちはこれらの問題の解決にもコンペが有効だと考えている。結論からいえば、コンペの成績優秀者や関心の高い参加者と企業をマッチングすればよいのだ。理由は至極単純だ。企業が採用すべきは、自社の課題解決に貢献できる能力を持つ人材だ。一方で、AI人材が選ぶべきは、自分の才能を最大限に活かすことのできる企業だ。であれば、実際に仕事をしてみるのが手っ取り早い。もはやコンペのテーマ=求人票とみなすことができる。採用基準は上手に解決できた人や解決意欲の高い人だ。実際、FacebookやAirbnbなどの最先端企業は、現場で抱えている業務課題とデータをコンペとして公開し、上位者から面接を実施(もちろん人材採用とは、技術力だけで決まる話ではない)採用につなげている。まさに即戦力人材だ。これ以上、具体性の高い方法が他にあるだろうか?仮に上位者に振り向いてもらえなかったとしても、テーマに関心のある多数のAI人材たちと繋がることができるし、AI人材のコミュニティに対するブランド形成が可能だ。結果、優れた人材の採用確率が飛躍的に上がる。実は支援側企業が持っていない「リアルな業務課題と実データ」こそ、AI人材を惹きつける強力な武器になり得るのだ。多くの優秀なAI人材は、事業会社の中に眠る挑戦しがいのある技術課題・データの存在に気づいていない、というか気づきようがない。非効率にも転職を繰り返して自分の天職を追い求めるのだ(か無難なポジションから動かない)。これこそ社会にとって最大の機会損失だ。コンペを通じてAI人材に対して具体的に事業会社の魅力を感じてもらうことにより、我が国特有である「支援側企業へのAI人材の偏り」を何とか是正できないものだろうか?
実はSIGNATEに登録するAI人材の約半数は、転職に一定の興味を示している。ただし、全員が転職先を積極的に探している訳ではなく、いい条件(活躍できる環境や今よりよい待遇など)であれば検討したいというスタンスの方も多い。彼ら、彼女らには過去のコンペ成績など即戦力(少なくとも手が動く)を証明する強力な武器がある。2020年内にSIGNATEとして、前述のミスマッチを改善する新サービスを開始する予定だ。よって僕たちにとって
「高い具体性・透明性でAI人材と企業をマッチングするシステム」の実現は、これからのチャレンジだ。(図右下「優秀人材」のフロー)
※人材流動化のチャレンジは進捗に応じて、ここに課題や成果を出していく予定である。
次回は、コンペが「教育機関の困りごとを解決」にどのような役割を担うことができるのかを議論してみたい。長文お付き合いいただきありがとうございました。