【スト6】2024年度SFL出場選手の個人スタッツをデータ分析してみた
はじめに
SFLの予選リーグが終わったので大学で学んでいる回帰分析を用いたデータ分析を行ってみました。データ分析に関してはほぼ赤ちゃん同然なのですが少しでも参考になれば幸いです。
使用したデータ
・SFL公式サイトで公開されている勝利数及び個人スタッツ
https://sf.esports.capcom.com/sp/sfl/2024/ranking/
・CFNで公開されている各選手の「過去100戦平均のバトルの傾向」(11/17日時点)
https://www.streetfighter.com/6/buckler/ja-jp
ただし、ノイズになりそうだと判断した項目については除外しました(後ほど詳細)。
注意事項
まず選手名に関しまして、敬称を省略して表記させていただきます。ご了承ください。
またこのようなデータの利用に際し、上記2つのサイトの利用規約を確認して問題がないと判断をした上で行っています。しかし、利用規約に反している、または出場選手自身がこの記事を読み不快に感じたなどの問題がありましたら、X(@SweepinSheep)にdmでの連絡をお願いします。できるだけ早く記事の削除などといった対応をします。
分析結果
バトル勝率
![](https://assets.st-note.com/img/1732686439-XBwody8JIsecGz3ibKYUn0V6.png?width=1200)
データ分析とは異なりますがせっかくなのでまとめてみました。
SFL公式サイトのランキングとは異なる側面も見れて面白いと思います。(例えば、ひかるの勝率が60%未満で意外と高くないなど)
個人スタッツ
SFLの個人スタッツは出場回数が多いほど回数も多くなってしまうので
回数÷総バトル数
をしてある程度補正してます。総バトル数にした理由は後ほど。
・最大値、最小値、中央値、平均値
![](https://assets.st-note.com/img/1733065108-4Z9jQzn8FBraRGSDfl6TNJEt.png?width=1200)
・各項目がバトル勝率に与える影響の大きさ
目的変数をバトル勝率に設定しRidge回帰を実行しました。
単に回帰分析を行うとDゲージを使用する技の係数がとんでもなく大きくなってしまうのですが、それはそれで面白い傾向が見られたのでおまけパートで取り上げます。
![](https://assets.st-note.com/img/1733045613-5RqaEwfQWMhLUeAF1KCNH6lT.png?width=1200)
ドライブリバーサル~壁際に相手から追い詰められている時間はCFNのスタッツ
グラフの見方
・グラフが右に長い(係数がプラスに大きい)ほど勝率が高い原因
・グラフが左に長い(係数がマイナスに大きい)ほど勝率が低い要因
雑な解釈
・パリィは慎重に使え!
「自分のパリィを投げられた」が最も大きなマイナス
パリィに成功しても4回に1回はジャストパリィに成功しないとマイナスの
評価
・対空は出なくても勝てる!
ああ
対空出なくてもなんか勝つ
特に難しい通常技対空は狙う必要なさそう
・勇気を持って投げ抜けを通せ!
投げ抜けは2番目に大きなプラス
慎重なプレイや様子見択が多いリーグでもここぞという場面は読み切って
押せ!
おわりに
ここまで読んでくださりありがとうございます。以降は分析方法の詳細などになるのでいったんここで〆たいと思います。
他にもデータから読み取れることは色々ありそうですが、スト6が人生初格ゲーでしかもテリー実装以降プレイしていないので皆さんに任せようと思います。
こういうことが言えそう!いやそれは違うんじゃない?などアイデアがあればコメントしてくれるとありがたいです。
おまけ
分析方法の詳細
目的変数をバトル勝率、説明変数をSFLの個人スタッツから「『ドライブラッシュ、キャンセルドライブラッシュ、ドライブインパクト、ドライブパリィ、ジャストパリィ、ドライブリバーサル、オーバードライブ、ドライブゲージ使用ブロック数、バーンアウト』を各選手の総バトル数で割った数値」と、「対空成功率、投げ抜け成功率、無敵技暴れ成功率」 CFNから「ドライブリバーサル使用回数、ドライブパリィ成功回数、相手のドライブパリィを投げた、自分のドライブパリィを投げられた、ジャストパリィ回数、ドライブインパクトを決めた回数、ドライブインパクトを受けた回数、投げを決めた回数、投げを受けた回数、投げ抜け回数、壁際に相手を追い詰めている時間、壁際に相手から追い詰められている時間」の合計24項目に設定し回帰分析を行いました。
その結果「ドライブラッシュ、キャンセルドライブラッシュ、ドライブインパクト、ドライブリバーサル、オーバードライブ、ドライブゲージ使用ブロック数」の係数が他の項目より圧倒的に大きくなってしまったため、大きい係数にペナルティを与えられるRidge回帰をさらに行い、その結果をもとに分析結果の解釈をしました。
また、回数を総バトル数で割った理由は以下の3つです。
・ラウンド数も数えたがカウントを間違えてる可能性が出たため
・CFNの個人スタッツが1バトルあたりの平均回数(秒数)であるため。
・より正確にはラウンドのプレイ時間に影響すると思い、それならもうガバガバでよくね?と開き直ったため
![](https://assets.st-note.com/img/1733061701-KYwL5guCq4UJ6B8VtEIpmnON.png?width=1200)
項目名が公式のものと異なるが、
日本語で表記したのがSFL、英語表記はCFNのデータとなっています。
標準誤差やp値が非常に高いためデータ分析としてははっきり言って正しくないと思います。しかし人vs人の対戦であるためプレイヤーの傾向の完璧な推定は不可能だという判断、得られた係数が自身の直感と大きくかけ離れていない(一部を除く)、格闘ゲームにおいてデータ分析が有効なのか検証したい、といった理由によりこのnoteを投稿することにしました。
はじめにでも述べましたが、これらのデータ分析は大学で学んだ程度ですので詳しい人からしたら様々な問題点があると思われます。コーチング募集。
Dゲージ使用技の傾向について
係数が非常に大きくなってしまった「ドライブラッシュ、キャンセルドライブラッシュ、ドライブインパクト、ドライブリバーサル、オーバードライブ、ドライブゲージ使用ブロック数」についてもう一度見てみましょう。
・1ゲージ
ドライブラッシュ -101.41111
ドライブインパクト -105.98374
・2ゲージ
ドライブリバーサル -235.63347
オーバードライブ -200.64543
・3ゲージ
キャンセルドライブラッシュ -304.16461
このように並べるとDゲージの消費量と係数の大きさが比例していることがわかると思います。つまりDゲージ1本当たりの技の性能はすべて同じと考えることが可能です。
しかし係数がマイナスになってしまう理由については解釈ができませんでした。
除外したデータについて
SFLの個人スタッツからは「ドライブインパクト返し、ドライブインパクト/パリィ受け」の2項目、CFNからは「パニッシュカウンターを決めた回数(インパクト)、相手のドライブインパクトに決めた回数(インパクト)、パニッシュカウンターを受けた回数(インパクト)、相手にドライブインパクトで返された回数(インパクト)、スタンさせた回数、スタンさせられた回数」の6項目を除外しました。
理由は殆どの選手が0回であり分析する価値もない上に、他の説明変数に悪影響をもたらすリスクがあったためです。ですがその代わりにプロプレイヤーはインパクトを全く使わないし喰らわない、バーンアウトもしないという情報を得ることができました。
この分析の問題点
最後にこの分析の問題点のうちパッと思いついたものをいくつか挙げておきます。
・弾ジャスパとそれ以外のジャスパの区別がない
・リーサル下でのバーンアウトとそれ以外の区別がない
・対ダルシム戦の対空成功率の算出がおかしい