怪談妖怪好きのデータ分析【Google Colaboratory +Python】妖怪美術館に関するTwitter傾向を出してみた
先日Googleコラボラトリを使ったところ、その威力について感動した話は先日したばかりですが、
さらに進んでTwitterのAPIと連携してのテキスト分析を試してみました。
今の私の感想を言いましょう。Twitterとの相性についても、Googleコラボラトリの使い勝手は素晴らしいと思いました!
※なんだか先日からGoogleコラボラトリを絶賛しすぎてますね。たぶん、暫くしたらこの熱が冷めて、「こういう弱点がある」「こういうことには使えねー」とブーブー言い始めるかもしれませんが💦。まあ、今は熱いうちに、熱い文体のままで、Googleコラボラトリ紹介続けます。
お試しとしては、日本の妖怪観光地を取り上げて、そこに関する最近のTwitterでのつぶやきをワードクラウド化しようと思います。
私の気になる観光スポット、小豆島の「妖怪美術館」を取り上げましょう!
Googleコラボラトリに新規のノートブックを立ち上げて、Twitterから発行してもらったアクセストークンを登録し、Oauthで認証を開きます。
あとはTwitterAPIで検索キーワードからの結果を取得し、テキストマイニングにかけます(※このあたりの手順はもっと整理したら詳しく公開したいと思います)。
で、小豆島の妖怪美術館の場合。
いちおう、出ました!微妙なアルファベット(WとかRTとか!)をうまく除外しないといけないですが、それは今後の課題。
続いて、三次もののけミュージアムでやった場合。
さらに、境港妖怪ロードでやった場合。
「河童の三平」らしいものが微妙に全体を引っ張っているのは何なのでしょうね、フムム?
今回は、お試しでテキストマイニングを回してみただけの段階なので、まずはこの辺りで。
今後、もっと、深めていきます!
▼Pythonでのテキスト分析の考え方はこちらの書籍が参考になります!最終章にGoogleコラボラトリでの環境準備の仕方が載っています▼