Clubhouseのビッグデータは何に役立つか〜シンボルデータとクオリアデータ〜

2021年2月16日 17:43

Google、facebook、Twitter、InstagramなどのSNSは我々の個人情報を貯めて、あらゆる人間の人間モデルを作ろうとしている。つまり、地球上の各個人について彼らを深く理解し、その言動をシュミレーションしようとしている。

なぜ、そんなことをするか？

それは、そのモデルを利用して各人の言動を操作しようとしているからだ。ビジネス利用でいえば、広告がメインとなる。行動原理がわかっていれば、的確な広告を打ち、お金を払ってもらえる。

また、統治者の利用用途といえば、言動を統制するためにも用いられうる。つまり、デジタルレーニン主義だ。その他、用途は沢山ありうる。

取ろうと思えば取れるデータの範囲

もし、人間のあらゆるデータを取れるとしたら、何が取れるだろうか。

仮にドローンで特定の個人を24/7で追跡できるとするなら、様々な角度から動画データである個人の一生を記録することができる。（それにかかるコストはおいておいて）

また、同様に高性能のマイクがあれば、その人の一生分の発話を全て音声及びそれをテキスト化したデータで記録できる。

また、大便や小便などの排泄物は、自宅など決まった場所であれば採取できるし時間も記録できる。ただし、外出時や野糞までは採取できない。（ただ、やろうと思えばドローンとかでできるかもしれない）

スマートウォッチみたいなものをつければ心拍数や体温なども取ることできるだろう。

現実性は置いておけば、頭に何か装置をつけて脳神経の発火みたいなのもデータで取れるだろう。

さて、

ありとあらゆる人間の行動データをとって、何ができるだろうか。これは人間に限らず世界のデータに広げて考えてみてもいい。

世界中の至るところにカメラとマイクを設置したり、空気や温度などを測ってデータを蓄積したら、何ができるだろうか。

３種類のデータ（属性、行動、クオリア）

人間について、或いは世界について記録できるデータを、３種類にわけて考えたい。

１．属性データ

まず、こちらは性別、名前、住所などの属性のこと。状態に対するテキスト記述といえる。Facebookであれば、まず、各ユーザーが自分で入力する学歴や職歴だ。さらには、AさんとBさんと友達関係にある、というのもここに入る。

２．行動データ

行動データは、言語化できる行動に関する記述といえる。Googleであれば、われわれが検索ツールで何を調べたか、さらにはChromeであればどのサイトを訪れたかの履歴が全てわかる。これはネット上の行動の大部分が把握されるということだ。

また、Facebookでいうと、ある友達とのコミュニケーション内容は行動データといえる。彼らは、AさんがBさんに◯月◯日に「明日、時間あったら一緒にランチしよう」というようなメッセージを送ったと把握できる。

Amazonや中国のalipayやアントフィナンシャルなどは大量の支払いや信用データという行動データを持っている。お金を払うという行為は、かなり人々の内面の状態を反映していると思われるから、人間モデルを作る上で大変に重宝するだろう。

この属性データと行動データを合わせて、シンボルデータと呼び、次のクオリアデータと対比させる。

３．クオリアデータ

最後に、クオリアデータ。こちらはいわゆる映像や音声で記録できるものだ。いわば、テキストで扱えないデータといえ、ありありしたデータ。ノンバーバルな情報。

例えば、Clubhouseでいえば、音声で「何をいうか」、つまりテキストに文字起こししたものは「行動データ」だが、それをどういう声質で、速さで、言うかについては音声データからしかわからない。自信を持っていっているのか、震えているのか、など。これがクオリアデータ。

これは「言語」というシンボルで処理を行っていないという意味で、シンボルデータと対照的である。

こう考えてみると、人間の五感のうち、視覚と聴覚は一定レベルで記録できるが、嗅覚、触覚、味覚は記録して再現することができない。

データの限界

シンボルデータ（クオリアデータ以外の属性、行動データ）はどうしても解釈が入ってしまう。テキストデータをベースに分析していては、シンボルグラウンディング問題により、根本的に「真実」に近づくことはできない。

簡単にいうと、「猫」というテキストなどの記号と、それが指すありありとした質的な「猫」の意味や概念の結びつきが恣意的だということ。シンボルデータが扱うのはこの記号であり、クオリアデータはこの意味や概念側のデータといえる。

（クオリアデータでさえも、カメラやマイクが扱えるデータに変換しているので解釈がはいっているし、もっと言えば、人間の体験も人間の認識装置を通じた認識であり、カント的な「物自体」にはたどり着けない）

ユクスキュルという生物学者が、種の異なる生物は、全く異なった実存感覚を持っている、というものだ。つまり、われわれ人間からすれば、「人間」と識別できても、猫からしたら、人間も猿も同類だし、極端な話、アメーバからしたら、世界に概念は「よい」「わるい」の２つしかないかもしれない。

こうした概念のズレは、我々人間の間でも原理的に残っている。

ある概念が何を意味するかは、それを使う主体の経験によって決まる。それがコンピュータなら、それにインプットされたデータだ。

どういうことか。

つまり、「毎日僕の味噌汁を作ってください」という昭和のプロポーズを文字通り受け取ってしまう。こういう言語行為は意味の投げ手の意図と、状況により受け手が総合的に判断することで成り立つ。

スパコンに何を計算させるか

こうして仮に世界や人間の充実したビッグデータが取れたとしたら、スーパーコンピューターに、どういう計算をさせるのだろうか。

「幸せ」になれる条件を計算させて、それを実現するための社会を作るのか。

「幸せ」という語（シンボル）が意味するものは人によって異なる。そもそもそれを経験したことがなく、本や他者から聞いたことがあるだけであれば、それにリアリティはない。

それに、そもそも「幸せ」を目標にして生きたい、というのも限られた人たちしか賛同されないだろう。

病気の原因を特定したり、犯罪のための事実確認などには、世界のデータは一定の貢献が期待できそうだ。

Clubhouseの可能性

GoogleもFacebookも、基本的にシンボルデータ（属性、行動）から、ある個人がどういうメンタリティで、どういう行動をしうるかという一つのモデルを作っている、といえる。You TubeやInstagramも、結局はその中身をテキストというシンボルに変えて分析しているので同じ。

Clubhouseが新しいのは、会話データという、クオリアデータをストックできることだ。

ただ、これによって、何がわかるか。

人の話し方というノンバーバルなところから汲み取れるのは、あまりないと思われるが、会話の内容をテキスト化すればその行動データには新規性があるか？

普通に考えると、TwitterやFacebookなどには出てこない種類の内容となるのではと考える。しかし、会話であるから逆に人々は慎重に言葉を選ぶだろう。普通、みんなGoogleの検索履歴を見られたくないと思うが、そこで検索した内容を全て会話で触れるかというと、そうではない。むしろ恥ずかしいことや私的なことも含め、会話より検索サイトに自分をさらけ出すだろう。

そう考えると、Clubhouseが手にできるユニークな情報ってなんだろう。

一つは、「今」話しているという時間的な情報だ。

世界中で今なされている会話の分析ができれば、同じ話題で話している人たちをマッチングできる。

例えば、日本で「ユニクロの着こなし方」という話題で会話をしていたら、それを以前話していた、或いは今話しているアメリカ人に、その事実を伝え、一緒に話す機会を提供できる。これは新しい。

それくらいしか現状思いつかない。