【#にじさんじアルプススタンド】Twitter情報を収集してレポート化してみた
今年も開催されるにじさんじ甲子園。そのファンアートが投稿される#にじさんじアルプススタンドのツイートを収集してレポート化してみました。
実際のレポートはこちら
スマホでは見ずらいと思いますので、画面のスクリーンショットを載せておきます。
なぜ収集しようと思ったのか?
ざっくりこんな感じです。
にじさんじ甲子園の盛り上がりがどれぐらいなのか知りたかった
海外のツイートがどれぐらいあるのか知りたかった
ファンアートがタイムラインに埋もれるのでできるだけ多く見たい
あわよくば、運営さんがファンアート収集に役立ててほしい
データ分析をしてみたいという興味が一番。あわよくば、運営さんがファンアートを探すのに役立てて貰えば嬉しいなぁという感じです。(多分運営さんは運営さんで収集しているので、不要だとは思いますが)
レポートにしてみた結果分かったこと
海外のツイートは少ない
にじさんじENのVox Akumaをはじめ、KRなど海外勢も多く活動していますが、#にじさんじアルプススタンドでは海外勢のツイートは非常に少ない状態でした。英語に関しては、日本の方が英語でツイートしても英語判定になるので、実際には外国語は少なくなりそうです。
さらに、不明という分類は「ハッシュタグのみ」「画像のみ」のツイートだったりして、言語の判別が出来なかった場合に不明になります。チェックした限りでは、ほとんどが日本の方。全てをチェックした訳ではありませんが90%近くが日本のツイートということになります。
海外の方のツイートが少ないのは、
ハッシュタグが日本語である為か
海外ではあまり投稿されていないのか
海外ならではのハッシュタグがあるのか
原因は分かっていませんが、海外のツイートはまだ少ない状態でした。
ツイートは1日100件前後しかない
ツイート数は1日100件前後でした。RTを収集していないので、実際のツイート数はもっと多いんですが、元となるツイートは1日100件程度しかありません。
まだ開催まで時間がありファン全体に熱が伝わり切ってないのか、思ったよりも少ないと思いました。
レポートの作成(超ざっくり)
レポートの作成はざっくりこんな手順
Power AutomateでTwitterからデータを取得
スプレッドシートにデータを格納
Googleデータポータルでレポート化
検討したけど断念したこと
レポートにPower BIを使う
データの取得にPower Automateを使うため、同じMicrosoft製品のPower BIを使おうと最初は考えていました。
しかしPower BIでは画像の表示サイズに限界があり、画像を大きく表示することができませんでした。
#にじさんじアルプススタンドを収集するので、画像は大きく表示させたい。小さくなっていては意味がありません。
もしかすると大きく表示する方法があるかも知れませんが、私が調べた限りでは150px以上の大きさに設定はできませんでした。
ツイート収集にGoogle Apps Scriptを使う
Power BIの使用を断念したタイミングでMicrosoft製品以外の利用を考えました。
無料のツールとしてすぐに候補に上がったのがGoogle。Microsoft同様、Googleにも同じようなツールが揃っていましたが、GASはちょっと面倒そう。
Power Automateであれば検索するキーワードを設定し、Twitterアカウントを認証させるだけでTwitterの収集ができます。
すぐデータの取得を始めたかったので、GASは断念。
データ収集の際、日付が文字列になる件
Power Automateでツイートの投稿日時を取得しますが、Googleスプレッドシートに追加する際、必ず「'」が先頭に入り、文字列として日付が挿入されます。Excelにデータを挿入する場合にはこの現象は起きません。
Googleスプレッドシートではマクロの定期実行で解決しましたが、標準の機能で解決できたのか、調べるのは断念しました。
function nijisanji2022arupusu() {
var spreadsheet = SpreadsheetApp.getActive();
spreadsheet.getRange('B:B').activate();
spreadsheet.getActiveRangeList().setNumberFormat('yyyy/MM/dd H:mm:ss');
};
「#にじさんじ甲子園」の収集
「#にじさんじアルプススタンド」の収集と同時に、「#にじさんじ甲子園」の収集もしようと思っていました。
しかし、Power AutomateでのTwitterの収集は1時間に12回まで、1回につき100ツイートが限界。#にじさんじ甲子園は5分で100を超えるツイートがあり、収集したところで多くのツイートが取得できません。データ分析でデータの欠損が大きすぎると思い断念しました。
工夫を凝らせば100件以上の取得もできそうですが、おそらくANYCOKORがSNSの分析はしているでしょうし、ファンがTwitterの分析に興味があるとも思わないので、断念。
まとめ
Twitterの収集は思ったより簡単で、さっくりできました。ただ、大量のツイートの分析には、別の方法が必要なので、そちらはまた調べて勉強してみたいと思います。