【#にじさんじアルプススタンド】Twitter情報を収集してレポート化してみた

今年も開催されるにじさんじ甲子園。そのファンアートが投稿される#にじさんじアルプススタンドのツイートを収集してレポート化してみました。

実際のレポートはこちら

スマホでは見ずらいと思いますので、画面のスクリーンショットを載せておきます。

なぜ収集しようと思ったのか?

ざっくりこんな感じです。

  1. にじさんじ甲子園の盛り上がりがどれぐらいなのか知りたかった

  2. 海外のツイートがどれぐらいあるのか知りたかった

  3. ファンアートがタイムラインに埋もれるのでできるだけ多く見たい

  4. あわよくば、運営さんがファンアート収集に役立ててほしい

データ分析をしてみたいという興味が一番。あわよくば、運営さんがファンアートを探すのに役立てて貰えば嬉しいなぁという感じです。(多分運営さんは運営さんで収集しているので、不要だとは思いますが)


レポートにしてみた結果分かったこと

海外のツイートは少ない

にじさんじENのVox Akumaをはじめ、KRなど海外勢も多く活動していますが、#にじさんじアルプススタンドでは海外勢のツイートは非常に少ない状態でした。英語に関しては、日本の方が英語でツイートしても英語判定になるので、実際には外国語は少なくなりそうです。

さらに、不明という分類は「ハッシュタグのみ」「画像のみ」のツイートだったりして、言語の判別が出来なかった場合に不明になります。チェックした限りでは、ほとんどが日本の方。全てをチェックした訳ではありませんが90%近くが日本のツイートということになります。

海外の方のツイートが少ないのは、

  • ハッシュタグが日本語である為か

  • 海外ではあまり投稿されていないのか

  • 海外ならではのハッシュタグがあるのか

原因は分かっていませんが、海外のツイートはまだ少ない状態でした。


ツイートは1日100件前後しかない

ツイート数は1日100件前後でした。RTを収集していないので、実際のツイート数はもっと多いんですが、元となるツイートは1日100件程度しかありません。
まだ開催まで時間がありファン全体に熱が伝わり切ってないのか、思ったよりも少ないと思いました。


レポートの作成(超ざっくり)

レポートの作成はざっくりこんな手順

  1. Power AutomateでTwitterからデータを取得

  2. スプレッドシートにデータを格納

  3. Googleデータポータルでレポート化


検討したけど断念したこと

レポートにPower BIを使う

データの取得にPower Automateを使うため、同じMicrosoft製品のPower BIを使おうと最初は考えていました。
しかしPower BIでは画像の表示サイズに限界があり、画像を大きく表示することができませんでした。

#にじさんじアルプススタンドを収集するので、画像は大きく表示させたい。小さくなっていては意味がありません。

もしかすると大きく表示する方法があるかも知れませんが、私が調べた限りでは150px以上の大きさに設定はできませんでした。


ツイート収集にGoogle Apps Scriptを使う

Power BIの使用を断念したタイミングでMicrosoft製品以外の利用を考えました。
無料のツールとしてすぐに候補に上がったのがGoogle。Microsoft同様、Googleにも同じようなツールが揃っていましたが、GASはちょっと面倒そう。

Power Automateであれば検索するキーワードを設定し、Twitterアカウントを認証させるだけでTwitterの収集ができます。

すぐデータの取得を始めたかったので、GASは断念。


データ収集の際、日付が文字列になる件

Power Automateでツイートの投稿日時を取得しますが、Googleスプレッドシートに追加する際、必ず「'」が先頭に入り、文字列として日付が挿入されます。Excelにデータを挿入する場合にはこの現象は起きません。

Googleスプレッドシートではマクロの定期実行で解決しましたが、標準の機能で解決できたのか、調べるのは断念しました。

function nijisanji2022arupusu() {
  var spreadsheet = SpreadsheetApp.getActive();
  spreadsheet.getRange('B:B').activate();
  spreadsheet.getActiveRangeList().setNumberFormat('yyyy/MM/dd H:mm:ss');
};


「#にじさんじ甲子園」の収集

「#にじさんじアルプススタンド」の収集と同時に、「#にじさんじ甲子園」の収集もしようと思っていました。
しかし、Power AutomateでのTwitterの収集は1時間に12回まで、1回につき100ツイートが限界。#にじさんじ甲子園は5分で100を超えるツイートがあり、収集したところで多くのツイートが取得できません。データ分析でデータの欠損が大きすぎると思い断念しました。

工夫を凝らせば100件以上の取得もできそうですが、おそらくANYCOKORがSNSの分析はしているでしょうし、ファンがTwitterの分析に興味があるとも思わないので、断念。

まとめ

Twitterの収集は思ったより簡単で、さっくりできました。ただ、大量のツイートの分析には、別の方法が必要なので、そちらはまた調べて勉強してみたいと思います。