見出し画像

3 ビッグデータが価値を生み出す仕組み

 『データ資本主義』が2019年9月18日に日本経済新聞出版社から刊行されます。これは、その第1章の3です。

3 ビッグデータが価値を生み出す仕組み
◇ 情報は昔から重要だった

データや情報は昔から重要だった。戦争は情報の戦いであった。ローマ時代からそうであった。情報が戦闘の結果を左右したことは、第2次世界大戦におけるミッドウェー海戦の例を引くまでもなく、明らかだ。そうした情報を獲得するために、スパイが暗躍した。
ビジネスも情報の戦いだ。あらゆる経済活動は、データの活用と密接に関連してなされてきた。ビジネスにはさまざまなデータが必要だ。そうしたデータは、利用者自身がコストをかけて収集する場合もあるし、データの取引も行われてきた。専門の業者が収集して外販される場合もある。
ここで重要な点は、「以上で述べた情報は、一つひとつを取り上げても価値があるものだった」ということだ。
それゆえ、秘密にされる。そして、有償での売買もなされてきたのだ。
なお、「知識」「情報」「データ」という言葉が、似た意味を持つものとしてしばしば使われる。これらについて明確な区別があるわけではないが、本書では、つぎのように使うこととする。
知識は体系的であるが、情報はこれより断片的だ。情報は価値があるのに対して、データは価値があるかどうか分からない場合もある。
ビッグデータの場合、個々のデータは価値がない
情報の価値という意味で、ビッグデータはこれまでの情報とは違う。
ビッグデータの例として本章の1で述べたようなものは、一つずつを取り上げれば、経済的な価値がそれほど高いものではない。多くの場合、無価値に近いといってもよいだろう。
ビッグデータを構成しているデータとは、たとえば、ある人がどんな言葉を検索したかとか、ある人がフェイスブックでどのサイトに「いいね!」のマークをつけたかといったものだからだ。これらのデータは、一つひとつをとれば、ほとんど経済的価値はない。また秘密にされているわけでもない。
このため、ビッグデータを構成する個別のデータを売買の対象とすることなど、とても考えられない。もともと情報は売買することが容易ではないが、ビッグデータで対象とされるデータについてはとくに売買がむずかしい。この点が、従来の情報と根本的に違う点だ。
したがって、「ビッグデータがなぜ、特定の企業に経済的価値をもたらすのか?」という理由は自明ではない。


◇ マネタイゼイションの仕組み
ビッグデータを構成する個々のデータを取り上げると、ほとんど価値がない。ところが、膨大な数のデータが集まると、それらを分析することにより、経済的な価値が出てくる。この点が従来の情報やデータと比べた場合の最大の違いだ。
ビッグデータから経済的価値を引き出すには、特別な仕組みが必要だ。「マネタイゼイションの仕組みが必要」といってもよい。
それに成功した企業が、グーグルとフェイスブックだ。これらの企業は、検索やSNSサービスを提供することによってビッグデータを収集し、それを利用して新しいタイプの広告を行うことで、巨額の収入を得た。
すでに述べたように、ビッグデータの世界とは、われわれの日常的感覚に比べると、宇宙サイズのものだ。それにAIがからむことによって初めて利益を生み出すことが可能になったのだ。このメカニズムも、従来の常識では理解できないものだ。
グーグルとフェイスブックのような企業にとって、データは利益の源泉だ。それは、工場や店舗などの伝統的な固定資産に代わる新しい「資産」になっている(それが具体的にどの程度の価値かについて、第6章の3で推計を試みる)。
ただし、グーグルもフェイスブックも、当初から意図的にこうした事業を展開しようとしたわけではなかった。グーグルの場合、高性能の検索エンジンを開発することはできたが、それをマネタイズする仕組みはなかったのだ(利用料金を徴収する方式は機能しなかった)。
このことからも分かるように、ビッグデータは、データが集まれば自動的に価値が得られるというものではない。そこから経済的利益を得るには、特別の仕掛け(ビジネスモデル)が必要だ。それは、従来はなかった仕組みであり、それを生み出すのは容易なことではない。
実際、ビッグデータを保有する企業がすべて巨額の利益を得ているわけではない。たとえば、ツイッターは長年赤字を続けてきた。


◇ AI機械学習の訓練データに用いる
ビッグデータがどのように活用されているかは、第2章と3章で述べる。ここでその概略を述べておこう。
まずAIの機械学習がある。第2章で述べるように、AIの機械学習において、「学習データ(訓練データ)」が用いられる。これによって、モデルのパラメータ(係数など)を調整し、そのモデルで予測などを行うのだ。とくに、パタン認識のための機械学習では、大量のデータを用いる。
AIの学習データはビッグデータである必要はないが、ビッグデータを用いるほうが精度の高い結果を得られる場合が多い。したがって、AIの技術開発においては、ビッグデータをどれだけ集められるかが重要だ。


◇ プロファイリングへの利用
第3章で述べるように、ビッグデータはプロファイリングにも利用される。これは、相手がどういう人(あるいは企業)であるかを推定する作業だ。スコアリング(点数付け)、フィルタリング(不正取引などの検知)なども同じようなサービスである。
プロファイリングは、これまで、主としてターゲティング広告(相手の属性に合わせた広告)のために行われてきた。グーグルやフェイスブックは、こうした広告によって巨額の収入を得てきたのである。
ただし、有料で得たデータを使うとなると、採算に合うかどうかが問題となる。したがって、どのようなコストでビッグデータを集められるかが、ビッグデータ利用の今後の発展を決めるだろう。




いいなと思ったら応援しよう!