見出し画像

ひとなチャレンジを分析する

この記事は、花寄女子寮 Advent Calendar 2020の11日目の記事です。
(※今回の記事果てしなく花寄要素薄いです)


昨日の記事では、こっひーがハッシュタグをつけたひとなチャレンジを始めて1年、「色んな事があったなぁ」っていう出来事的に振り返りをしました。

今日はデータ的に振り返って分析してみます。

昨日の振り返りはこれをやりたかったがための前座といっても過言ではない。

さて、なぜそんなことをしたいと思ったのかというところですが、
1年も続いてるとなると、そのツイート数は相当なものになります。
もはや宝の山です。

そこで、

・一体何人の人たちがこのハッシュタグで呟いてきたのか。
・一年の中でツイート数にどのような変化があったのか。
・ギリチャレが白熱していたと入ったが果たして本当か。
・ツイート内容にどのような変化があったのか。

などなど、ツイートをデータ分析するとけっこう面白そうだと思ったので、ちょっとやってみたいと思った次第です。
11:07にツイートするというひとなチャレンジの特性上、分析しやすいデータ群でもありますしね。

あと個人的にPythonを忘れないよう触るいい機会だと思ったのも理由です。

ただ統計学や分析を専門としていたことはなく、多少かじっていた程度なので、おかしなところがあったらすみません・・・

では、どんな結果が見られるか分かりませんが、早速行ってみましょー!


分析データ

分析に用いたデータは以下のとおりです。

分析対象
- ハッシュタグ #ひとなチャレンジ がついたツイート(非公開アカウントのツイートは含まず)
対象期間
- 2019年12月10日から2020年12月9日まで


総ツイート数

まず、Twitter APIで対象期間の#ひとなチャレンジがついたツイートを検索して取得したところ、総データ数は16,653件でした。

ただ、この中にはリツイートによる重複も含まれているので、それを除外すると、14,952件になります。(APIで取得する時にリツイート除外とかやれたらいいのですが、無料だとできないので仕方なくこういう感じに。)

つまり、この1年間の#ひとなチャレンジは、全部で14,952ツイート!
こうして数字に出すと、めっちゃ多いですね〜!

スクリーンショット 2020-12-10 3.18.23


成功ツイート数

次にこのツイートの中で、ひとチャレに成功しているツイートの数はどうなるのか。ぎりぎり間に合わなかったり、「あっ…」って失敗することありますよね。

ひとチャレ成功ツイート数は、12,534ツイートでした!
2,418ツイートも失敗してるんですねー。まあ、ギリギリにツイートする勢がいるので、その人たちの失敗が響いてる感じですかね?

スクリーンショット 2020-12-10 10.43.14


参加者数

他に基本的な情報としては、ひとなチャレンジの参加者数とかでしょうか。
一体何人の人たちが#ひとなチャレンジのついたツイートをしてきたのか。

結果としては、290人でした!

これは人によって感じ方違うと思いますが、個人的にはめっちゃ多い気がします!一日あたりここまで行くことはないのですが、全体としてみると結構な参加者がいたんですねー。

スクリーンショット 2020-12-10 10.41.53


参加者個人のチャレンジ数と成功数

全体として、ひとチャレツイート数とひとチャレ成功ツイート数を出したので、一人ひとりに対して出してみました。流石に参加者全員290人のデータ全部だと多すぎるので、成功数で並べて、こっひーのところまで出します。

count_totalがひとなチャレンジ数
count_successがひとなチャレンジ成功数

スクリーンショット 2020-12-10 10.41.25

こっひーのチャレンジ数に対する成功数の少なさがとても目立つ。笑
まあ、こっひーは通知行かないように11:07の終わりギリギリにツイートしてますからね。しゃーなし。

わたし(polaris)は思ったより失敗していなかったですねー。
ちなみに、こっひー以上に失敗してる人たちもいます。(載ってないですが)
本人は分かってそうですし、なんならギリギリで競ってた人たちは、誰なのか想像つきそうですね。笑
(わたしも結果見て、そうだよなぁ、めっちゃ失敗してたもんなぁって思ってしまいました。笑)

11:07:59.999 と 11:07:00.000 のツイート

話に出てきたギリギリのひとチャレツイートについて。

ひとなチャレンジの真のギリギリは、11:07:59.999です。
これ以上ないギリギリですね。
果たしてこんなツイート時間のひとチャレはあるのか…!
結果は……

スクリーンショット 2020-12-10 10.52.58

なんと6ツイートもありました。
正直、9/28と11/25のわたし(polaris)以外のツイートが、このギリギリの時間を達成していたことは当時知っていたのですが、これ見るまで9/28と11/25のは知りませんでした。いつの間にか3回も取っていたんだなぁ…

ちなみにこれらのツイートは、user.screen_nameの値とid_strの値を使い、以下のようにURLを作ることで、確認することができます。
https://twitter.com/polaris1113/status/1310400835872931840


では、11:07の終わりギリギリの反対である、11:07:00.000、11時7分の始まりちょうどのツイートはあるのか。早速結果ーー

スクリーンショット 2020-12-10 10.54.22

1件だけあった!!
11:07:00.000も少しミスれば、1106になってしまいますし、なかなか難しい。そんな中ただ一人だけ。すごい。


1日の参加者数の推移

個々のデータはこれくらいにして、全体的な話に戻ります。

まずひとなチャレンジが始まってから参加者、つまりツイート数がどのように変化してきたのかを分析します。

以下のグラフにおいて、上は1日のツイート数のグラフで、下は1日のツイート数の移動平均を求めたグラフです。上のグラフでもなんとなく分かりますが、移動平均のグラフなら、この1年の参加者数の推移や変化の傾向が分かりやすいですね。

横軸は日付で、縦軸はツイート数になります。

画像7

上と下を見比べると、3月にかけて参加者が増えていて、4月あたりがピークなのが分かります。

そして5月に一際飛び出て、69ツイートに達してるところがあります。これ、5月4日、こっひーの誕生日です。誕生日だからこそこの日、沢山の人がひとなチャレンジしてたんですねー。

また5月くらいから少し減ってきてますねー。おそらく4月終わりくらいから、こっひーがひとチャレ成功したツイートに対してリプするのをやめた影響もあるのかなーと思ってます。というかそれまでこれだけのツイート数にほぼ毎日リプしていたのがすごすぎた。

そしてそして11月7日、ひとなの日!
またしてもめっちゃツイート数が飛び出てる!
ピークの頃から減っている中で、こっひーの誕生日よりも沢山の参加者!
さすがひとなの日。1日で76ツイートにもなっていました。

記念の日には普段なかなかできない人とかも頑張ってる感じでしょうか。(土曜日というのもタイミング的には良かったかもしれない)
こんな些細なことですが、やっぱりこっひー愛されてるんだなぁと思ったり。


ひとなチャレンジのツイート時間

最後にひとなチャレンジのツイート時間について。

ひとえに11:07と言っても、11:07:00.000から11:07:59.999まで1分間の幅があります。それこそギリギリチャレンジなんてのもありますし。

そこで、
・11:07のどのタイミングでツイートしているのか、その傾向
前回の記事でギリギリチャレンジの競争率が激しくなっていたと書いたがそれは本当だったのか
などそのあたりを分析してみます。


以下は、ツイート時間と1日ごとのツイート時間の中央値を月別にプロットしたグラフです。
横軸は日付、縦軸はツイート時間です。
青色の点は、各ツイートのツイート時間で、赤色の折れ線は1日ごとのツイート時間の中央値を結んだものになります。

また、このグラフに用いたデータは11:07の前後5秒を含めた範囲のデータです。ギリギリを突き詰めた結果失敗したツイートやちょっとフライングしてしまったツイートを含めつつ、時間の離れたツイートは外れ値として除きたかったためです。

画像9

青色の点を見ると、11:07全体に渡って均等にツイートされてないことが分かりますね。最初と最後の方などに偏りがあります。

そこで、赤色のグラフである中央値、つまり1日の参加者のちょうど真ん中のツイートのツイート時間を求め、全体と比べることで、その日のツイートが11:07の最初と最後どちらに偏っているのか、ギリギリチャレンジしてる人が多いのかどうかが大まかに分かります。

ただこれだと全然傾向がわからないですね。


なので、赤色のグラフだけを取り出して、1年分つなげてみます。

下の図の上のグラフが、さっきの赤色をつなげたものです。つなげてもなお、上下にブレまくってて分かりづらいので、下のグラフのように移動平均を取ります。これで平滑化されて傾向が見えるようになりました。

画像9

5月頭にかけて、中央値が大きくなっています。ツイート時間の青色の点と照らし合わせると、11:07の後半のツイート時間は、最後の方に固まっていることから、ギリギリチャレンジの挑戦者が増えていること、競争が激しくなっていることが推察できます。昨日の記事で3月4月にギリチャレの競争率が激しくなったと書きましたが、概ね合っていそうだということが確認できました。

また9月から10月の頭あたりでも大きくなっていますが、これは1日のツイート数のグラフから参加者が減っていることが確認できるので、ギリギリにツイートしている人たち以外のところで人数が減ったというような推察もできそうです。


おわりに

ここまでとす!

ということで今回は、ひとなチャレンジのツイートを分析しました。どうでしたでしょうか。

正直完全にわたしがやりたかったことをやっただけです。

わたしはやってて、結果が見えてすごく面白かったのですが、果たしてこれ、読むひとにとっては面白かったのだろうか……笑
刺さるひとには刺さるような気はしますが、果てしなく少なそう。

しかし、このようにしてデータを数値やグラフとして可視化することで、今まで何となくふんわりした印象だったものが、はっきりどういうものか見えてきて面白いと思いませんか?

時間がなかったので、今回これくらいしか分析できませんでしたが、もし自分でも他にも分析してみたいという方、あるいは今回やったことを自分でも試してみたい方、興味のある方がいらっしゃれば、ツイートデータを共有しますので、声をかけていただければと思います。ソースコードの共有なども要望があればします。(コード汚いですが。)


いやあ、しかし無駄に全力尽くしてしまったなあ。

おわり。



この記事が気に入ったらサポートをしてみませんか?