【Twitter X Python】結局、何をしたらフォロワーが増えるのかデータで分析してみた
今回の可視化の目的
ここ最近ツイッターのフォロワー数を増やすノウハウ的な記事が増えてきているような気がします。いろいろな人がいろいろ言っています。
よく言うノウハウ系の記事では、ツイッターのフォロワーが増やるためには、以下の値を増やせばよいと主張しています。
・RT数を増やす
・ツイート数を増やす
・いいね数を増やす
しかし、フォロワー数が多い人が言っていることは、結果的には正しいけど、本当にどの変数が関係しているのかはわかりませんね。
そこで今回は、フォロワー数が、どのような変数によって増えるのかを、データによって可視化してみました。
使用するデータ
Pythonを利用して、過去5カ月分の過去の自分のツイートと、その投稿のRT数、いいね数を取得したデータ(never_be_a_pm.csv)をPythonのAPIを利用して取得しました。また、過去4カ月分の私のフォロワー数の増減データ(follower.csv)も自分で作成して取得しました(Webのツールを利用すると取得できます)。
以下最初の画像が投稿のいいね数とRT数のデータ、次の画像がフォロワー数の増減データとなります。
never_be_pm.csvはまずTwitter APIを利用して取得しました。その時のコードがこちらです。
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import tweepy
import csv
import time
# 各種ツイッターのキーをセット
CONSUMER_KEY = ""
CONSUMER_SECRET = ""
ACCESS_TOKEN = ""
ACCESS_TOKEN_SECRET = ""
#Tweepy
auth = tweepy.OAuthHandler(CONSUMER_KEY, CONSUMER_SECRET)
auth.set_access_token(ACCESS_TOKEN, ACCESS_TOKEN_SECRET)
#APIインスタンスを作成
api = tweepy.API(auth)
#ツイート取得
tweet_data = []
#取得するツイッターアカウントを指定
screen_name = "never_be_a_pm"
#CSVのファイル名
csv_filename = '{}.csv'.format(screen_name)
for tweet in tweepy.Cursor(api.user_timeline,screen_name = screen_name,exclude_replies = True, exclude_retweets = True).items():
try:
if not "RT @" in tweet.text:
tweet_data.append([tweet.id,tweet.created_at,tweet.text.replace('\n',''),tweet.favorite_count,tweet.retweet_count])
print(tweet_data)
except Exception as e:
print(e)
time.sleep(15)
#csv出力(アカウント名で保存)
with open('{}.csv'.format(screen_name), 'w',newline='',encoding='utf-8') as f:
writer = csv.writer(f, lineterminator='\n')
writer.writerow(["id","created_at","text","fav","RT"])
writer.writerows(tweet_data)
このデータ(never_be_a_pm.csv)PythonのPandas, Matplotlib, Seabornを利用してデータの前処理、可視化を行いました。
分析
今回は、一日のフォロワー増加数(follower_increase)が、以下の値と比較して、どれが一番相関しているか確認してみました。
・RT数を増やす: RT
・ツイート数を増やす : count
・いいね数を増やす : fav
具体的な処理については、有料部分でデータとJupyter Notebookとともに公開しています。
結果
1日のフォロワー数の増加(follower_increase)にもっとも関係する変数と、最初はグラフにして比較してみました。
・RT数を増やす: RT
・ツイート数を増やす : count
・いいね数を増やす : fav
最初に、リツイート数とフォロワー数の増減((follower_increase))を確認したところ、どうやらリツイートが伸びてからフォロワーが次の日に増えている感じがしたので、その日のフォロワー数の増減ではなく、次の日のフォロワー数の増減(lag_follower_increase)を指定して、フォロワー数の伸びを分析しました。
これらの値の相関行列を取得し、相関係数を確認したところ、以下のようになりました。
・いいね数を増やす: r = 0.29 (弱い相関)
・RT数を増やす: r = 0.24 (弱い相関)
・ツイート数を増やす r = 0.05 (ほぼ相関なし相関)
ということで、とにかくRTが伸びてかつたくさんファボがつくツイートをすることがよさそうです。ツイートの回数はそこまで影響がなく、とにかく伸びて愛されるツイートをすることが大事なようでした。
参考までに以下相関行列を散布図にして、示したものとなります。
最後に
本当だったら重回帰分析等でどの変数が影響を与えているのか見たかったのですが、RT数といいね数の相関係数が高すぎたので、マルチコになるのでやめました。あとほかによい変数が思い当たらなかったので、よかったら教えてください!
同じようにデータを分析してみたい方は、Google Drive上にデータを保存しておきます。まだ、こちらの分析のJupyter Notebookを保存しておきますので、試してみたい方はどうぞ!
ここから先は
¥ 1,980 (数量限定:残り 7 / 10)
サポートでいただいたお金はFanzaの動画を購入するために利用されます。