
中国のデータサイエンティスト育成の仕組み
データサイエンティストは世界中でニーズが高まっている。大学は専門学科を立ち上げたりするなど教育を進めているが、人材不足の問題はずっと続いている。
中国トップレベルのデータサービスプロバイダー「TalkingData」のリサーチによると、2025年時点で、データ人材は約二百万人不足すると見込まれている。中国では、データサイエンティスト不足にどのように対応しているのか、事例を紹介したい。
中国政府はデータドリブン社会の構築に注力
政府の政策は、直接データサイエンティスト不足問題を解決できないが、データドリブンの社会環境を構築し、人材育成するための活発な社会の雰囲気と条件を提供している。
中国政府は、2015年に初めてビッグデータ戦略を国家戦略として取り上げている。政府各機関はこの戦略を実行するため、各領域で政策を頒布している。
(※1:工信部の全称は中華人民共和国工業和信息化部と呼ぶ。主に工業、情報通信、バイオ、医薬、新材料、航空宇宙など中国の科学技術に関する産業や業界を主管している。政府部門のIT化の推進も担当している。日本の総務省に相当。)
国家レベルの基本政策以外に、各地方政府も所轄地方でデータ産業を促進するために、データ専門の産業園区を作ったり、データ関係の企業に便宜な政策を提供したり、データサイエンティストの育成に優遇条件を提供している。
企業同士がデータサイエンティスト育成のエコシステムを形成
産業の成長と人材の育成には、政策上、大きな支持を提供しているが、データの人材不足は企業にとって、頭を抱える課題である。よりレベルの高いデータサイエンティスト不足はさらに顕著な課題である。
各企業は採用に力を入れているが、全体の母数が少ないため、ニーズにはなかなか賄わない。企業は自社で育成することがますます重要になっている。
しかし、教育するには大きな投資をしなければならない。米国のレポートでも触れたが、データサイエンティストの育成は10年かかるという説がある。
中国の人材流動はとても激しい。LinkedIn(2017年)の調査によると、中国人の平均在籍時間は、わずか26ヶ月にとどまっている。投資をしたが、回収できる見込みは読めないため、多くの企業は、自社教育に多大な投資することを躊躇している。また、データサイエンスは数多くの知識を必要とするため、企業内でそもそも指導できる人がいないのも課題の一つである。
そこで生まれたのが、データサイエンティスト育成のエコシステムである。つまり、企業内で教育するだけではなく、外部の企業、コミュニティなどと連携して、育成していく。
データサイエンスは、統計学、コンピュータサイエンス、マシンラーニング、ビジネスなど複数の領域を跨る学問であるため、情報量が非常に多く、常に進化している。習得するには、自己勉強能力以外に、意欲と継続力が必要である。企業は、予算が限られているため、社内で人材育成する際に、このような条件の中で適切な候補者を選定しなければならない。
1)外部の教育リソースを活用
教育において、大学の教育や伝統的な研修機構以外に、オンライン教育プラットフォームとベンダ教育プラットフォームが発達している。
<オンライン教育プラットフォーム>
グローバルでも有名なCoursearaとUdemy以外に、中国独自のオンラインプラットフォームも人気がある。幕课はCourseraと似ているような仕組みで、中国の有名大学の授業コースは、一般人でもオンラインで受けられるため、企業内の候補者は、在籍中でも問題なく勉強することができる。TDUはデータサービスプロバイダーのTalkingData社が提供しているオンライン教育サービスである。中国国内外のデータサイエンティストを招待し、専門のデータサイエンティストの講座を開設している。企業に対して、カスタマイズのオンライン教育コースも提供している。
<ベンダ教育プラットフォーム>
中国大手のインターネットサービスベンダーである。Alibaba、Tencent、Baiduは自社の社員教育のために作った教育システムを次々と外部に提供するようになった。中国のトップ企業として、データサイエンスのレベルアップの社会責任を果たす以外に、自社製品のブランディングと市場シェアの拡大を狙う目的もある。AWSも同じ目的で2018年に北京交通大学と協力して、AWS雲創学院を開設した。
企業はオンライン教育プラットフォームとベンダ教育プラットフォームから、自社のニーズに合いそうな項目を選定し、社員育成に利用することで、高度な知識、より柔軟な選択と適切な予算を実現することができる。そういったサービスを提供している企業から見ると、このサービスを利用するユーザーが増え、収益が増えることは、自社製品の増収にも繋がっている。
2)実践プラットフォームで、理論知識を応用までにレベルアップ
データサイエンスの教育には、理論知識をどのようにして実際のビジネスに応用するかがとても重要である。オンライン実践プラットフォームは、各業界や各ビジネスシーンに出そうなケースを模擬し、対策を訓練する。
例えば、cookdata社は、6つの総合実践プラットフォームを提供している。
①銀行の顧客リスク評価
②精密マーケティング実践プラットフォーム
③ヘルスケアビッグデータ総合実践データプラットフォーム
④ビッグデータプラットフォーム構築の実践
⑤交通ビッグデータ総合実践プラットフォーム
⑥農業ビッグデータ実践プラットフォーム
3)コンペとクラウドソーシングプラットフォーム
世界では、kaggleは世界中一番有名なデータサイエンティストのコンペプラットフォームとして知られているが、中国にも「天池(Tianchi)」「科赛(Kosay)」など有名なコンペプラットフォームがある。その中に、AliやTencentなどの大手企業がスポンサーになっているものが多いが、一般企業でも利用することができる。
このようなプラットフォームに参加することは、自社のデータサイエンティストのチーム構築や、データサイエンティストの評価に役立つ。現在、データサイエンティストを採用する際に、コンペの参加経験が必須になっている企業は増えている。
また、コンペプラットフォームはクラウドソーシングプラットフォームとして兼用することも多い。クラウドアウトソーシングは人材不足の企業に対して、新たな人材活用の手段を提供している。直接の教育効果はないが、外部のリソースを利用することにより、内部のデータサイエンティストチームに新鮮な啓発を提供することができる。
まとめ
データサイエンティストの育成は一挙に成し遂げることができない。長期にわたる覚悟が必要である。そして、1社で独自にできることでもない。
特に、中小企業の場合は外部との連携が大事になるため、エコシステムはいい選択であると考える。
<著者・編集>劉 海琪
<サポート> 金敏
<共同編集> Donald Thompson、Charles Jewett、李偉良、Melanie Sweeney、金敏
<日本語校閲> 小室奈々、鈴木優華
<参考資料>
http://www.moe.gov.cn/srcsite/A16/s7062/201804/t20180410_332722.html
http://www.moe.gov.cn/jyb_xxgk/moe_1777/moe_1778/201511/t20151130_221853.html
https://gaokao.chsi.com.cn/gkxx/zc/moe/201703/20170301/1669197998.html
https://www.sohu.com/a/215526810_714267
http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm
http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm
http://www.gov.cn/zhengce/2020-05/16/content_5512110.htm
http://cn.chinadaily.com.cn/2017-09/05/content_31595709.htm
http://cookdata.cn/training/