![図1](https://assets.st-note.com/production/uploads/images/19086018/rectangle_large_type_2_e6dfc5f79af53361f637e8403d6e994e.png?width=1200)
Pythonでデータ分析〜安倍首相のツイートを分析してみた
ちょっと前まで参院選が盛り上がってましたね。
今や、多くの政党がインスタとかツイッターとか、SNSを駆使してます。
Kaggleでこんなデータがありましたので、Pythonで色々こねくらせてもらった次第です。
安部首相のツイッターアカウントの「2016年-2017年」のツイート(日付、英訳、いいね数 etc.)を整理してるデータです。
ちなみに、トランプ大統領のtweetを分析したnoteもありますので、良かったら。
色々やる前に、データの整形
そのままだと、扱いづらいところもあるので、いくつか前処理をして整形。
全部で77行のデータです。
※いつものように「jupyter notebook」を使用
いつ、どのくらいツイートされてるのだろう
ってことで、まずはツイートの頻度とかタイミングをば。
①年月別のツイート頻度
2016-2017の間で年月別のツイート数をカウントしたもの。
17年10月のツイートが多いのは、言わずもがな、2017年々の参院選の影響。ツイッターも強力な選挙活動の武器なのでしょう。
②曜日別のツイート頻度
ツイートされた曜日別に集計して、並び替えたものでございやす。
「木→金→土→水→火→日→月」の順番で多い。
所謂、ホワイトカラー(平日仕事、土日休み)の有権者に見られやすい(週末に近づくほど見る?)から、かもしれない?
③ちなみに、曜日別のフォロワーの反応の違いは
各ツイートの「リプライ(replies)」「リツイート(retweets)」「いいね(likes)」がデータ内にあります。各曜日別で、上記3つの反応の平均を出してみました。
※「いいね(likes)」の平均が高い曜日順で並び替え
・「リプライ(replies)」は、土曜日、金曜日、日曜日が相対的に多い?
・「リツート(retweets)」は、土曜日、水曜日、火曜日が相対的に多い?
・「いいね(likes)」もリツイートと同じ傾向
数字だとこちらです。
リプライ、リツイート、いいねが多かったツイート
フォロワーからの反応(いいね、リツイート、リプライ)が多かったツイートを見てみようかしら、と。
●「リプライ」が多かったTOP5
●「リツイート」が多かったTOP5
●「いいね」が多かったTOP5
リツイートといいねは一緒ですな。
↓の通り相関関係が高いからそらそうですね
★ツイートのポジネガ判定
各ツイートのポジネガ判定をやってみました。
簡単に説明すると、各ツイートに対して以下をやってます。
●そのツイートは「ポジティブ」か「ネガティブ」がどちらに該当するか
●「ポジティブ」と「ネガティブ」それぞれどれだけパワーがあるか
↑の表では、左側に4つの列を追加。
・sentiment_positive →どれだけポジティブか
・sentiment_negative →どれだけネガティブか
・sentiment →ポジティブかネガティブどっちか(上記2つの大きい方)
・sentiment_net →ポジティブとネガティブのスコアの差引
こちらのやりかたは、以前、「M-1で高得点がとれる漫才」の分析をした際のこちらのnoteにやり方を記載してますので、よかったらどうぞ。
①ツイートのポジネガ割合はどうなの、と。
ポジティブなツイート、ネガティブなツイートの割合みてみた。
ほぼ、ポジティブ。
②ポジティブ【TOP10】ツイートはどんなのかしら、と。
新年の挨拶、首脳会談、選挙に関して、地震や原発に関してがヒットしました。
②ネガティブ【TOP10】ツイートどんなのかしら、と。
菅元総理に関して、核、北朝鮮関連のツイートがヒットしました。
★ツイートを6つの感情で分析
ポジティブ/ネガティブだと2パターンだったので面白みに欠けたので、6つの感情(エクマン理論)を測定してみようと思います。
こちら↓のライブラリを使わせていただき、各ツイートから6つの感情を測定してみました。
angry(怒り),disgust(嫌悪),fear(恐怖),happy(幸福),sad(悲しみ),surprise(驚き)
やり方はこちら。→sentimentja: 日本語感情分析のpythonパッケージ
もしくはこちら。→コチラ
下記のように、各ツイートに対して6つの感情スコアを追加。
※列名は、
a = angry(怒り),d = disgust(嫌悪),f = fear(恐怖),h = happy(幸福),s = sad(悲しみ),su = surprise(驚き)
①6つの感情の割合はどんな感じかな
全ツイートの6つの感情それぞれのスコアを合算して、構成比出しました。
angryが相対的に多く、続いてhappyが多い。
怒りが多いのは、ちと不思議。
どんなツイートが該当してるのか、実際にみてみよう。
②「😡angry感情」TOP5ツイートはこちら
概ねangryを捉えているが、3つ目などは「選挙に対しての"アツい"ツイート」ですね。
「アツい思い」のツイートも、「こうあるべきだ!」というある種angryな感情が入ってるってことでしょうか。
③「❤️happy感情」TOP5ツイートはこちら
経済効果に関する内容や、ミスコン、プレミアムフライデーなどの内容。
ほっこり、ほのぼのします。お疲れ様です。
④「6つの感情」と「フォロワーの反応」
フォロワーの反応(いいね、リツイート、リプライ)と6つの感情の関係性(相関)がこちら。
そこまで相関係数は大きくないけど、
●happyなツイートと「いいね、リツイート、リプライ」は若干相関
●disgustなツイートは、逆相関
ってとこでしょうか。
まぁ、そらそうやわな。
はい、以上。
トランプ大統領のtweetの分析もしてるので、こちらも良かったらどうぞ。
おまけ🍡ワードクラウド作ってみた
最後に、ツイートのワードクラウドを作って遊んでみました。
①ワードクラウド
②CoolなEnglish ver.も作ってみた
以上のワードクラウドの作り方はこちら👇
ツイートのポジネガ判定と感情分析のやり方はこちら
↑の二つはこちらのマガジンに両方入っていて、お得です。
楽しんでもらえたら幸いです。
貴重なお時間をありがとうございました。
いいなと思ったら応援しよう!
![マイキー_Mikey](https://assets.st-note.com/production/uploads/images/54772130/profile_ca49eb3809999159d32b1908763a3c1d.jpg?width=600&crop=1:1,smart)