YouTuberをデータサイエンティストが分析してみた
分析対象のYouTuberは!(^○^)
1. コムドット
2. ブライアンチャンネル
3. エンジニアチャンネル
4. おめがシスターズ
5. あまり驚かないガッチマンはゲームばかりしている
この中には動画を1回もみたことないYouTuberもいるけど、まぁそこは気にせず。
別に分析して欲しい人がいたらコメントしてくれると助かります👍
どのデータを分析するのか?
YouTubeAPIからpythonでデータとってその後、Rで分析するって感じのフローかな
参考記事↓
ソースコードの説明に関しては省略させていただく
取得しているパラメータの説明
全部使えるかどうかわからないけど、とりあえず使えそうなやつをいろいろ取ってきた。
動画時間の分布
動画数のサンプルは4029件だがそのうちのおよそ97%以上の動画は3600秒つまり1時間以内であることがわかる。
そして、特に動画時間で多いのは1200秒の10分前後の動画であることがわかる。
個人的10分の動画を見かけることが多いが、みたことないYouTuberも同じ戦略を取っているらしい。これはYouTuberの共通認識みたいなものなのだろうか
そして、ガッチマン選手はその動画の性質上その他のYouTuberと比較して動画時間が長い傾向にあるようだ。
また、あのブライアンは動画時間が比較的短いし、動画数も少ないことがわかる。チャンネル登録者数に比較すると非常に少ない。彼の実力は凄まじいい。笑
低評価と高評価について
これに関しては一目瞭然。あきらかに相関がある。
まぁ心理学では常識だけど、好きの反対は無関心だからね。みてないユーザーはリアクションすることもできないし。
リアクションするってことはもうファンだよね。
まるで、「来ない客が一番、良い客だ!」と言っているアルバイト学生やな
それでも数の割合にはチャンネル間でかなりのばらつきがあることがわかる
評価数と視聴回数について
こんなの分析する必要があるのか?ってくらい直感的なものが出てきたね。
相関係数計算すると、95%有意水準で0.8709751 ~ 0.8851102。
そして、低評価と高評価が相関してるってことを踏まえると、評価とか気にせずガンガン行こう!!!って感じ?
動画時間と視聴回数
これにはかなりYouTuberの特色がでているのではないだろうか??
注目すべきはYouTuber コムドットに関して、動画時間が伸びれば伸びるほど、視聴回数も伸びている傾向にある。
はっきり言って、YouTuberのジャンルが全て異なるのでここから何かを相対的に見出すのは難しいかもしれない。
ただ仮説は立てることができる。
1. the YouTuberの動画は時間が長ければ長い方が見られる
2. ゲーム実況に関してはいつも同じくらいの動画時間のものが見られている
3. コント系は短いほうが視聴回数が高い。
そして、1つ奇妙な点はかなり短い動画の視聴回数が意外と高い点にある。これはなにか短い動画でバズったということなのか?
そろそろ終わろうか
課題はいくつか見つかった
同様のジャンルのYouTuberを比較すると新たなインサイトを得られる可能性が高い、あるいは仮説を検証できる
視聴回数は単純に比較するにはスケールが異なるので標準化などの作業が必要になる可能性が高い
あれ?てかチャンネル登録者数のデータ取るの忘れた。
とは言ってもチャンネル登録者数に関しては時系列で取得することができず、
例えばチャンネル登録者数とその視聴数の割合を出そうとしても不可能。
んー困った。
これ以上は仕事ならやるけど、仕事じゃないからいいや。お疲れ様でした!