見出し画像

コスプレツイートを統計データ化しトレンドを可視化するシステム(企画書)

はじめまして。駆け出しエンジニア兼コスプレイヤーのminagi Nao@nao0_cos)です。

今回は作成している仲間向けの企画書を作ると同時に、開発に手伝ってくれるボランティアの方を募集するために記事を書きます。

さて、雑談から。
「最近こんなコスが流行ってるんだ」「このコス最近見ないな……併せたいんだけどな……」なんて思った経験はありませんか?

そこでGoogle先生に聞いてみました。「流行りのコスプレはなぁに」と。

▲何のデータもなくふわっと「原神」が流行っていると紹介してきます。

Googleで「コスプレ 流行」などで検索すると……

Google先生が出す答えは、例えば2023/8/21現在では「推しの子」や「原神」のコスが流行ってます!とざっくりとしたキュレーションメディアの情報しか出ません

これを見て、「コスプレ」およびその他の表記+画像が添付されたツイートをプログラムで自動収集してジャンルを抜き出して、あわよくばキャラごとに統計を取れば、これまでとは違う視点でコスプレというサブカルチャーを分析できるのでは?
と考え、コスプレ自動分析システムの開発に着手しました。

統計をとるメリット

「コスプレ」という観点から「世の中のトレンド」を今までとは違った視点・統計方法で探ることができます。

また、キャラごとに統計をとる場合は併せのために買う衣装を参考にできます。
コスプレをしているキャラが人気度が高すぎると、併せのときに被る可能性がある。だから別のキャラにしよう……といったことができます。

また、私のような逆張りオタクにとっても非常に重宝します。


私はコスプレが好きですが、その会場で衣装被りは避けたいと思っている人間です。
そういった場合、この統計を使うことで「最近コスプレされていないキャラ」をあえて選択し、コス会場で被らないような戦略をとることもできます。

なにより今までふわっとメディアの情報で「このコスプレがトレンドだよ」と皆が調べ「そうなんだ。じゃあこのコスしよう」という流れになっていますが、明確な根拠がない以上、情報操作の可能性も捨てきれません。

もちろん、情報操作に関しては我々が作るシステムによるデータでも嘘をつける可能性がありますが、そもそも嘘をつくメリットがありませんし、統計の整合性を合わせるのは至難の業です。

また一週間に一回情報を収集し、レポートを提出する予定なので急な流行の変化の対応も乗り切れますし、流行の推移を追うこともできます。

具体的にどんなシステムなのか?言語は?

今流行のPythonでコスプレ関連のツイートから自動分析するシステムです。

コスプレ関係のツイートを集計し、その集計をジャンル分け、できればキャラも分けて、スプレッドシートに反映。
その後グラフを作成します。

集計イメージ(実際のシステムとは違う仮のデータです)
グラフ化。本番はもう少しわかりやすいグラフにしたいと思っています。

グラフはお世辞にも見やすいとは言えず、改善の余地が大幅にありますが、根本的なものは

コスプレツイートを収集→データ化→分類→グラフ化

このグラフと収集件数のレポートにより世の中のトレンドを伝えることができると考えています。

最終的には、ジャンル別キャラの集計も取っていきたいと考えています。

実際に、現在試しに開発しているシステムは「推しの子のどのキャラが割合として多くコスプレしているのか?」となっています。

Twitter(X)APIとの闘い

ここで避けて通れないのは改悪されたX(旧Twitter)APIです。
無料ではツイート収集に制限がかかり、一瞬でAPIを使い果たす(=収集上限に達する)ようになってしまいます。

特にイベントがある土・日なんかはあっという間に上限に達することでしょう。

もちろん、APIに課金をすればこの問題はクリアされますが、API
このシステムは趣味で開発を行っているため「Basic」(月額100ドル)、「Pro」(月額5000ドル)と本格的にするなら月70万もかかります
正直やってられません。

おのれイーロンマスク

そこで「Twitter API」取得制限は15分ごとに解除される仕様に目を付けました。
例えばツイート取得を何回に分け、1晩かけて取得することでこの課題は解決できます。

何をもってトレンドとすべきか?

グラフの見やすさよりも議論すべきポイントがあります。
それは「何をもってどのコスプレが流行っていると言えるのか?」です。

最初、この企画はRT数をカウントすることでした。しかし、RT数をカウントするとインフルエンサーが圧倒的に有利です。

たしかに「コスプレを見る人」のトレンドはこれでわかるかもしれませんが、私が知りたいのは「コスプレをする人」のトレンドです。

そこで「ポスト(ツイート)数」の多さを「トレンド」としました。

しかし、前段階の予測では「それでもインフルエンサーにマーケットは左右されるのではないか?インフルエンサーが流行を作り出すから」と予想する協力者もいます。

確かに面白い仮説ですが、システムを作らないことにはこちらの話もふわっとした仮定にすぎません。私は嘘偽りない真実を知りたい。

プライバシーと利用規約

ここまではデータを集めるのみに留まっていますが、欠かせないのはレイヤーの方々に対するプライバシー保守の徹底とX(旧Twitter)の利用規約の厳守です。

こちらは利用規約の 4. 本サービスの利用が中心に当てはまります。

当社があらゆる媒体または配信方法(既知のまたは今後開発される方法)を使ってかかるコンテンツを使用、コピー、複製、処理、改変、修正、公表、送信、表示および配信するための、世界的かつ非独占的ライセンス(サブライセンスを許諾する権利と共に)を当社に対し無償で許諾することになります。このライセンスによって、ユーザーは、当社や他の利用者に対し、ご自身のツイートを世界中で閲覧可能とすることを承認することになります。

Twitterサービス利用規約

今回は「ツイートの閲覧」のみの利用としています。バズったコスプレをサイト上でTwitter(X)で定められた埋め込みコードでサイトに埋め込む……などは、規約上では正しい手続きですが今回は想定していません。

もちろん集めたツイートのデータはジャンル分類のみに使用を限定しています。最終的に厳格に情報を守るために私しかデータ部分に触れないようにします。

これは、このシステムが生じた際の責任はすべて私が取ると同時に、開発協力者さんの情報漏洩のリスクを減らす意図があります。

仲間を募集しています!

最後の最後まで読んでくれたそこのあなた!興味があればやってみませんか?

大前提として

趣味で作るものなので報酬のやりとりは無し(そもそもこの企画自体すぐにお金にならない、労力だけでも赤字となっている為)
学生さんが企業を受ける際のポートフォリオとして使用するのは可

とさせていただきます。

もし興味があれば駆け出しエンジニア兼コスプレイヤーのminagi Nao@nao0_cos)まで。

金銭的支援者も募集

現状、趣味でシステムを作っており、時間と電気代を投資しています。
しかし開発者仲間に支援金を支給したいとも考えています。

そこで金銭的支援者も受け付けております。もしご支援くださったときはクレジットとして支援者として宣伝させてください。
モチベーションアップにもつながり、より良質なシステム開発につながります。

支援方法はこのnoteを購入後、minagi Nao@nao0_cos)にDMでnoteで購入したID(noteでの名前)を教えてください。よろしくお願いいたします。

ここから先は

86字

¥ 500

期間限定!PayPayで支払うと抽選でお得

この記事が気に入ったらチップで応援してみませんか?