データ資本主義 21世紀ゴールドラッシュの勝者は誰か はじめに
『データ資本主義』が2019年9月18日に日本経済新聞出版社から刊行されます。これは、その「はじめに」です。
はじめに データを制するものは世界を制するか
本書は、新しいタイプのデータである「ビッグデータ」について論じたものだ。
ビッグデータは、経済活動に新しい可能性を開く。AI(人工知能)はビッグデータによって賢くなる。そして、ビッグデータを活用することによって、これまではできなかったさまざまな新しい活動が可能となる。こうして、いま新しい経済社会が誕生しつつある。これを表すのに、本書は「データ資本主義」という概念を提示している。これは、ビッグデータを資本とする経済だ。
半面で、ビッグデータはさまざまな新しい問題を提起する。プラットフォーム企業と呼ばれる企業が市場を支配する可能性がある。それだけでなく、監視社会がもたらされる危険もある。
われわれはいま、歴史の大きな曲がり角にいるのだ。
では、ビッグデータは、従来の情報とどのように違うのか? 科学的な方法論はどのように変わってきているのか? データサイエンスは、どのような分析を行う学問なのか? 実際の企業は、それをどのように活用することができるのか? それによって企業活動はどう変わるのか?
新しい社会の基本的な特性は何か??それはどこに向かうのか??われわれは、それにどう対処したらよいのか?
こうしたことが、本書で解き明かしたいと思うテーマだ。
いま生じつつある大きな変化の中で、日本は大きく後れをとっている。世界最先端の動きには置き去りにされているといわざるをえない状況だ。これは、企業のビジネスモデルの問題でもあり、基礎的な教育研究体制の問題でもある。
こうした状態を変えるためにまず必要なのは、いま何が起きているかを正確に理解することだ。本書は、ビッグデータに関する日本の状況に強い危機感を抱いて書かれた。
本書が想定する読者は、データや情報に関する専門家だけではない。日本の現状に問題を感じているすべての方々に読んでいただくことを望んでいる。
本書は、専門的知識がなくても読み進められるように書かれている。コンピュータに関する概念が登場するが、コンピュータサイエンスの基礎知識なしで読めるように、重要概念については説明を加えた。
各章の概要は、以下のとおりだ。
第1章では、ビッグデータの概要を述べる。ビッグデータとは、スマートフォンやインターネットなどの利用を通じて集められるデータなど、従来はなかった新しいタイプのデータだ。
ビッグデータは、これまでの情報やデータとは、さまざまな点で違う。まず、「大きさ」の点で従来の情報やデータとは隔絶的な違いがある。また、個々のデータをとってみればさしたる価値があるわけではなく、大量に集積されて初めて価値を持つことも大きな違いだ。したがって、ビッグデータを価値あるものとするには、そのために特別の仕組みが必要になる。
ビッグデータは、AI(人工知能)のパタン認識のための学習データとして用いられる。これについて第2章で述べる。
パタン認識は夢の技術だったが、これまで長い間実現できなかった。最近それが急激に進歩しているが、これは、AIの機械学習でビッグデータを用いたディープラーニングの手法が用いられるようになったからだ。最初はランダムに係数を与え、データで学習させることによって徐々に係数を調整していくという方法が用いられている。「理論アプローチからデータアプローチへ」という方法論上の大きな転換が起こっているのだ。
AIのパタン認識は、自動車の自動運転など、実際の生活と社会の構造に大きな影響を与える可能性を持っている。
第3章では、プロファイリングについて述べる。これは、ビッグデータを用いて、個人の性格や嗜好などを推測する技術だ。プロファイリングのビジネスへの応用としては、ターゲティング広告やテレマティックス保険などがある。
プロファイリングは、匿名社会における問題を解決することができる。しかし、他方において、監視社会への道を開く危険もある。
第4章は、科学的方法論の見地からの議論だ。ビッグデータの登場は、科学的方法論にも基本的な影響を及ぼしつつある。これまで確立された科学的方法論は、「理論駆動型」のものだった。つまり、「理論こそ重要であって、理論のなきデータはクズに過ぎない」というものだ。この考えは、物理学の華々しい成功によって確立された。
これに対する「データ駆動型」の方法論のきっかけを作ったのは、1990年代のヒトゲノム解読計画におけるジョン・クレイグ・ヴェンターの「ショットガン」方式だった。その後、「データ駆動型」の方法論は、マテリアルズ・インフォマティクスなどの成果を生んでいる。そして、「理論は死んだ」といわれることもある。しかし、「データ駆動型」の方法論では、人間に理解できないところがある。この問題についての決着はまだついていないというべきだろう。
第5章では、データサイエンスについて述べる。データサイエンスは、単に「データを扱う科学」というだけの意味ではなく、「データ駆動型への転換」という方法論上の変化と深く結びついている。
データサイエンスの役割としては、つぎのようなものがある。第1は、AIの機械学習において、手法、モデル、変数の選択などを行うことだ。欠陥データへの対処は、実務上は非常に重要なことである。第2に、AIの機械学習における「過学習」(オーバーフィッティング)への対応がある。その第1の方法は「交差検証」(三人寄れば文殊の知恵)であり、第2の方法は「正則化」(複雑さの排除)だ。企業はデータサイエンティストを必要としているが、どのように使いこなすかは簡単でない。また、日本におけるデータサイエンティストの不足は深刻な問題だ。
データ資本主義を象徴しているのが、GAFA(グーグル、アップル、フェイスブック、アマゾン)やBAT(バイドゥ、アリババ、テンセント)と呼ばれる企業群だ。これについて第6章で述べる。
GAFAもBATも、20世紀の経済をリードしてきた企業とは違う。鉄鋼を作っているわけでも電気製品や自動車を作っているわけでもない。これらの企業が扱うのは情報だ。情報関連企業は20世紀にもあったが、これらの企業とも違う。大きな違いはビッグデータから価値を生み出していることだ。
この章では、プラットフォーム企業が保有しているビッグデータの価値についての定量的評価を試みている。グーグルやフェイスブックについては、その時価総額のほとんどが(建物や設備などの物理的資産の価値ではなく)ビッグデータの価値ではないかと考えられるのである。
日本の企業は、ビッグデータ利用の側面が弱い。IT(情報技術)で日本が立ち後れたが、その状態がさらに進もうとしている。
第7章では、プラットフォーム企業の支配力について見る。現状では、ビッグデータの収集と利用は、プラットフォーム企業によってほぼ独占されている。強い市場支配力を持ち、独占力の行使が目立つ場合もある。また、技術開発面でも独占している。
これに対して独占禁止法で対処しようとする動きがあるが、実効性のあるものとなるかどうか疑問だ。問題の本質は、プロファイリングされることそれ自体にある。最近のAI技術(とくに写真)によって、プラットフォーム企業によるビッグデータ収集が進んでいる。
第8章では、ビッグデータの将来についての動向を見る。まず、取引所や情報銀行などの形で、ビッグデータの有償取引が始まっていることを見る。
つぎに、電子マネーがビッグデータの新しい供給源として注目されていることを見る。最近の日本でQRコード決済の電子マネーの創設ラッシュが起きているが、その大きな目的はビッグデータの入手であろう。
ビッグデータは、これまではきわめて高い収益をもたらしてきた。しかし、それは、ビッグデータが無料で入手できたことによる面が強い。ビッグデータの入手にコストがかかるようになった場合、これまでのような高い収益を維持できるかどうかは疑問である。
ビッグデータがもたらす問題は、プラットフォーム企業の支配力増大だけではない。これが第9章のテーマだ。
第1に、顔認識を用いたプロファイリングによるプライバシーの危機がある。EU一般データ保護規則(GDPR)は、プロファイリングされない権利を認めたが、実効性のあるものになるかどうか、疑問だ。第2の問題は、政治の手段としてターゲティングが行われることだ。これによって、AI時代のビッグブラザーが登場する危険がある。
中国の社会では、プライバシー保護の意識が弱いので、ビッグデータを集めやすい。これによってAIの能力を高めることができる。こうした社会の存在をどう考えるかが、将来に向かっての重要な課題だ。