【有意義グラフ】無意味グラフbotに沸くスパムをグラフにしてみた
こんにちは!みずもとと申します。皆さん、Twitter楽しんでますか?
最近は色々あって、みんな他のSNSに行ってしまっています。置いて行かないで。
その「色々」の最たる例がスパムですよね。別名をインプレゾンビというように、あいつらはバズツイを嗅ぎつけては寄ってきます。そろそろ虫の図鑑に載る。
うちのbotも日頃スパムに沸かれているので困っているのですが、どうにもできていないという現状があります。
![](https://assets.st-note.com/img/1708671623075-tSkLdK0rKm.jpg?width=1200)
こうなったら、あいつらをグラフにして分析してやるしかない…
![](https://assets.st-note.com/img/1708619726460-SpyWucl1GM.jpg)
スパムたちをグラフにする
スパムを分析するということで、今回はスパムの数・ジャンル・沸く基準を探っていこうと思います。
1. 数別に分類する
まずはスパムの数・割合を円グラフにしていきます。
今回は一番リプライが多かったこのツイートを集計対象とします。
![](https://assets.st-note.com/img/1707108151875-gJDRnN9dHj.jpg?width=1200)
188個のリプが付いているはずなんですが、70個ぐらい見えなかったので見える分だけ集計します。残りも多分スパムだけど!
結果
↓
↓
↓
↓
↓
![](https://assets.st-note.com/img/1707726057524-Q7PdDWU1Oz.png)
人間2割?!!??
SNSってなんだっけ……
こんな風に、ツイートが伸びるとスパムはたくさん沸いてくれます。ひっくり返っちゃうね。
続いてはこの75個のスパムの中身を分析していきます。
2. 種類別に分類する
最初に、分類の元となるスパムの種類を挙げていきます。
①外国語型
スパムの王道ですね。アラビア語などを送ってきます
![](https://assets.st-note.com/img/1707106997562-hfC4zg5Vuu.jpg?width=1200)
②ChatGPT型
評価Fのレポートみてえな文を送ってきます
![](https://assets.st-note.com/img/1707107176721-Jz5CuJaKTO.jpg?width=1200)
③コピペ型
他人の引用やリプを丸パクリしてきます
インプレゾンビのゾンビ要素
![](https://assets.st-note.com/img/1707107458668-3ncRQULy7w.jpg?width=1200)
④絵文字型
任意の絵文字を送ってきます
1人で10回ぐらい送ってくるやつもいる 失敬しちゃう
![](https://assets.st-note.com/img/1707107769859-RPHZ3zKius.jpg?width=1200)
⑤その他
その他「……」のみのリプや、どこのか分からない文章を送ってきます
![](https://assets.st-note.com/img/1707107819868-rDqgivSpFW.jpg?width=1200)
これを元に種類別の円グラフを作っていきます。先程同様リプライが一番多かったツイートで集計してみます。
①外国語型、②ChatGPT型、③コピペ型、④絵文字型、⑤その他 一番多いのはどいつだ!
結果
↓
↓
↓
↓
↓
![](https://assets.st-note.com/img/1707727001832-taJ6PJan5u.png?width=1200)
めっちゃ拮抗してる!!
世はコピペ・外国語・絵文字のスパム三国時代!キャンペーンに応募して、推しスパムを応援しよう!!
ここまではスパムが沸いたツイートについて書いてきましたが、最後はどれだけツイートが伸びればスパムが沸くかをグラフにしていきます。
3. スパムが沸くラインを探る
まず、グラフの作成のために分類作業を行います。
これまでに投稿したツイートのリプ欄をそれぞれ参照し、スパムの沸き度合をたくさん・すこし・ほぼ無しの3段階に分け、その結果たくさんが13件、すこしが3件、ほぼ無しが43件でした。
母数がやや少ないですが、これを元に各いいね数・RT数・インプレッション数によるスパムの有無をグラフにしていきます。
ちょっと複雑だったかもごめん!!!
①いいね数
まずいいね数
個別に分けた結果はこんな感じ!
![](https://assets.st-note.com/img/1708086468428-V8WR9Qf023.jpg?width=1200)
3つをまとめると
![](https://assets.st-note.com/img/1708087906188-qqXzJuUfV0.png?width=1200)
3.0〜3.5の所に外れ値があるんですが、これはだいぶ初期(去年の10月)のツイートなのでまだそこまでスパムが多くなかったのかな……と考えます。
それを踏まえると1.5万いいねを超えるツイートにはスパムが沸きやすいということが分かります。
②RT数
続いてRT数
![](https://assets.st-note.com/img/1708086480771-6xKQbd29SM.jpg?width=1200)
3つをまとめると
![](https://assets.st-note.com/img/1708087941044-x4mKnqugBW.png?width=1200)
う、うーん?
これはなんとも言えないな……
スパムが沸くラインとRT数の相関はそんな強くないのかも。
③インプレッション数
最後にインプレッション数
![](https://assets.st-note.com/img/1708067579580-9mfYCMwBQw.jpg?width=1200)
3つをまとめると
![](https://assets.st-note.com/img/1708087961325-Ii7mpbfgFm.png?width=1200)
これは分かりやすい!
さっきと同じような外れ値の350〜400の1つを除けば、200万インプレッションを超えるツイートにはスパムが沸きやすいということが分かります。
以上から、スパムが沸くツイートの目安は1.5万いいね、200万インプレッションという結論が出ました!有意義!すごい!本当にありがとう!
おわりに
なかなかにガバガバ議論な気がしますが、ちゃんと結論が出てくれました。出てくれたからええやろ、な!
みなさんもスパムをグラフにしてみてはいかがでしょうか!
そのグラフがバズってスパムが沸いたら、伏線回収みたいですごくエモいと思います!
そんなとこで、これからも無意味グラフbotをよろしくお願いします。
以上です!
↓トイレピカピカ宣言
![](https://assets.st-note.com/img/1708102913434-51ltuhbu3K.jpg?width=1200)
おわり