見出し画像

自分がどのくらいエコーチェンバーの中にいるのか可視化するシステムを作ってみた

「ツイッターで見た」

計算社会科学という学問があります.社会科学にコンピュータサイエンスを導入して,これまでにない分析を行おうという学問です.最近日本でも計算社会科学会が発足するなど今盛り上がっている研究分野です.

そんな計算社会科学の分野で扱われる課題の一つに,ソーシャルメディアによる社会の分断の分析があります.アメリカ大統領選や新型コロナ禍でフェイクニュースを目にする機会が多くなりましたが,フェイクニュースや偏った情報の取得は,人々を分断させ社会を混乱させると言われています.

分断を生み出す要因の一つが,エコーチェンバー現象にあると言われています.これは,ソーシャルメディアなどでは自分と似たような価値観を持つ人とつながりがちであり,自分の意見をいうと周りから「そうだそうだ」と同意を得られ,自分の意見が社会全体の意見のように見えてしまう現象をいいます.実際にはソーシャルメディアで可視化されている範囲なんて,社会全体に比べればごく一部に過ぎないのに.

しかし,自分自身がどの程度偏った情報に触れているのかというのはなかなか認識しづらいものです.見えないものが存在することは気づけないものですから.

エコーチェンバー可視化システムβ

そこで,ツイッター限定ですが,どのくらい自分が見ている世界が偏っているのかを可視化するシステムを作ってみました.

エコーチェンバー可視化システムβ版

画像5

このシステムでは,ツイッター上のタイムライン,フォロー関係,リツイートしたツイートを分析して,その内容にどのくらい偏りがあるかを示します.

分析結果の読み方

画像1

タイムラインのエコーチェンバー度を分析した結果がこのように表示され,偏りの大きさを「エコーチェンバー度」として数値化しています.下のグラフは,これまでに算出したエコーチェンバー度における立ち位置を示しています.ただ,タイムライン上のユーザが少なすぎると正しく算出されないため,基本的にユーザ数100以上の場合を対象としてグラフを書いています.

なお,タイムラインのツイートは実は800件しか使っていません.何気にこれがTwitterAPIの限界なんですよね.もっと読み込ませてよ・・・

参考までに,この数値の算出方法は,ソーシャルメディアを用いた新型コロナ禍における感情変化の分析(人工知能学会論文誌速報論文,2020 年 35 巻 4 号 p. F-K45_1-7(07/2020))にあります.

画像2

その下にある図が,タイムライン上に現れた主なコミュニティでよく使われる言葉です.こんな単語に興味がある人がタイムライン上によく表れているんだな,と理解できます.この例で行くと,ワクチン関連,エンジニア,研究者などがタイムラインにいることが推測されます.偏ってる

同様の分析をタイムラインだけではなく,フォローしているユーザ,リツイートしたユーザについても行っています.

画像5

また,タイムライン上で特定の人だけが良く現れたりしていないかを示すために,ユーザごとの出現率を図示しています.この例だと1ユーザが16%近く占有しているので,タイムラインにそのユーザが与える影響は大きそうです.

画像3

保守やリベラルといった党派性が強い場合,より分断を加速する可能性があることを考慮して,その党派性の分布を算出したものを示しています.特定の政治的志向があると偏が見える可能性があります.

なお,結果は共有することができますが,共有したページではタイムライン登場回数トップ10ユーザは表示されません.・・・そういえば,自分のタイムラインの具体的な情報って個人情報なのかしら?

というわけで,エコーチェンバー可視化システムβ版を作成してみたので,興味がある方は使ってみてください.

ぼくらはエコーチェンバーの中

ところで,フォロワーが少なかったりするとどうしても偏りが出がちですが,特定の意図をもって使っているのであれば偏っていることが悪いことではないかと思います.例えば,日向坂46の情報を収集するためにツイッターを使っているユーザのタイムラインが偏るのは当たり前です.

エコーチェンバーの中にいるから問題なのではなくて,エコーチェンバーの中にいるという事を自覚することが大切だと思いますので,タイムラインの偏り具合を認識するくらいのつもりで使ってもらえればよいかと思います.

ちなみに,全く偏っていない場合,つまりツイッター上のコミュニティ分布と同じようなタイムラインを持っていれば,エコーチェンバー度は0になります.経験的に,エコーチェンバー度が1.0以下くらいだとユーザ分布はツイッター全体の分布と類似しているといって良いのではないかというレベルです.

ところが,これまでの分析結果だとタイムラインの偏りは平均で3.0以上ありそうです.ってことは,そもそも個人レベルで完全に偏りのないタイムラインを作ること自体が不可能なのかもしれません.なんてこったい.




この記事が気に入ったらサポートをしてみませんか?