国民民主党の定例記者会見(24/11/08)でのチャットコメントのトレンドワードを調べてみる
どうも、政治家として大好きな伊藤孝恵さんに"いいね!"をいただいて嬉しい破綻国家研究所です。
普段はデータサイエンスで飯を食ってます。
はじめに
これまで動画の文字おこしの抽出や、ライブチャットのコメントを抽出してきました。
このなかで、YouTubeライブのライブチャットのコメントはどういった傾向なのか?
ということをやっていませんでしたので、今回はライブチャットに寄せられる語句をランキング化してみました。
目的
ライブチャットの語句を抽出するだけでなく、
どういった語句が上位に並ぶかを知りたいから(個人的興味)。
目的にもよるけど、視聴者がに何に注目してたかわかるかもしれない。
コード
こちらにおいています。
いろいろ書き換えまくったので可読性は低いです。
環境
Jupyter notebook (Python3, ipykernel) WinPython
yt-dlpのためYouTube APIは不使用。
結果
ライブチャット頻出上位50単語
1位、2位は、まぁ当たり前でしょう。国民民主党の榛葉幹事長の定例会見なんだから。
3位に立憲民主党の立憲が入ってますね。記者が立憲関連の質問を多くしたためです。
そして4位に"横田"、あのフリーの横田記者です。遅刻したのに4位に入るんですね。
6位には深作ヘスス議員の"ヘスス"が入っています。トランプ政権になって、ホワイトハウスで働いて共和党や民主党にパイプのあるヘススさんが上位に挙がっています。やはり皆さん注目しているんですね。
50位までを見ると政策関連の語句が多いです。国民民主党の政策本位の姿勢が注目されていることがわかりますね。
ワードクラウドでの可視化
チャットの抽出単語をワードクラウドで可視化。
ネットワークグラフ(Network Graph)
今回新たにネットワークグラフを入れて、各単語がどの単語に関連しているか調べてみました。
上位20単語のみに限定しています。
['国民民主', '榛葉', '立憲', '横田', '自民', 'ヘスス', '質問', '日本',
'インボイス', '石破', '記者', '公明', '消費税', '社会保険', '国民',
'玉木', '松井', '政策', 'トランプ', '遅刻']
"日本"という単語に結びついているのが、ハリス、野田、玉木、石破、そしてヘススというのが面白い。
ヘススさん、チャット欄で外交を期待されてるのかもしれないですね。
そして"横田"という単語には、www、笑、横田wwなどでした。
横田記者、視聴者から笑われてんぞ。
出力データ
結果はこちらよりダウンロードを。
さいごに
フリーホッターは横田をアズカバンに送ってほしい
ほなまた