
新しいスタッツを作ってみよう 仕上げ編
今回は「新しいスタッツを作ってみよう」という企画の仕上げと行きたいと思います。
サーブ効果率 = (100×サービスエース+25×効果-25×ミス)÷打数
というサーブ効果率の計算式は、サービスエースは効果やミスの4倍の価値があるという意味になるのですが、果たしてこの価値設定は妥当なのかを検証し、必要とあらば新しい効果率の提案を行いたいと考えています。
サービスエース・効果・ミスの価値
というわけで、ここまでの分析ではサービスエース・効果・ミスの価値を分析してきました。まずは、サービスエースとミスの価値については、サービスエースをブレイク、ミスをサイドアウトによる得点と見立て、これらの得点が入ることへの勝敗への影響を以下の表のように求めました。
データは男子Vリーグ1部のものを用いています。
この数値は表の上にある統計モデルにおける、ブレイク(サービスエース)とサイドアウト(ミス)の係数を表したものですが、この係数を新効果率におけるサービスエースとミスの係数に用いてみたいと思います。
次に効果については、サーブが効果となった時のブレイク率を以下の表のように集計しました。
このデータより、サーブが効果となった場合には50.6%の確率でブレイクを獲得できるのであれば、効果の価値は、上記のサービスエースの50.6%で“0.50”という係数を設定してみました。
というわけで、既存の効果率に対して、以下のような新効果率の計算式を提案します。
スタッツは仕上げが9割
では、仕上げといきます。ここまで長々と分析してきましたが、実はこれからやる仕上げが、新しいスタッツの良し悪しを決めます。
仕上げというのは、新しいスタッツが『使える』かどうかを確認することです。
どんなに精緻な分析によって導かれたスタッツであっても、どんな高尚な思想信条に基づくスタッツであっても、『使える』ものでなければ意味はありません。
逆に、経験則や目分量で決めたようなスタッツであっても、『使える』ものであれば、それが優先されます。
制作過程よりも利用価値のほうが重要視されるというのはシビアに感じるかもしれませんが、現場に使えないものを提供しても仕方がないどころか、トラブルを招く恐れもあるので、ここは譲れないところだと考えます。
“使える”スタッツって何だ?
ところで『使える』スタッツとは、いったいどのようなものを指すのでしょうか?
これには正解というものは無く、また正解を定める必要はありません。どのような形でも良いので利用価値を示せば良いのです。
といっても、何でも良いというのは参考にはならないので、今回はオーソドックスな利用価値として以下の2点を設定します。
1.勝敗と連動していること
2.上記の効果が既存のスタッツよりも大きい
スタッツの増減とゲームに勝つ可能性が連動していれば、そのスタッツをチームの強化や改善の目標と定めることができます。逆に、スタッツの変化と勝敗に関係が無ければ、それは参考にしても仕方がないスタッツということになります。
このため新しいサーブ効果率と勝敗の関係を確認する必要があります。
もう1つは、既存のスタッツに対して新しいスタッツを導入しようとする場合、当たり前ですが、既存のスタッツ以上の価値が無ければ、わざわざ導入する必要がありません。
今回の場合、勝敗との関係が既存の効果率よりも強くない限りは、新しいスタッツとしての価値を認めることはできないということになります。
サーブ効果率と勝敗の関係
というわけで、サーブ効果率と勝敗の関係を、2017/18シーズンから2019/20シーズンまでのVリーグ男子1部のチームを対象に、レギュラーラウンドのチーム総合成績から、勝率と、既存のサーブ効果率と新サーブ効果率の関係を求めてみました。
まずは既存の効果率との関係を以下の図1に示します。
強い正の相関関係が認められ、効果率が高いほど勝率が高く、効果率が低いほど勝率は低くなっています。
新効果率はこれ以上に強い関係が認められなければ、使えるスタッツとはいえません。それでは、新効果率との関係を以下の図2に示します。
相関係数は、新効果率がわずかに低いですが、この値では相関の強さは同等と言って良いと思います。ただし、同等では『使える』スタッツとはいえません。
まぁこんなものです
以上の分析から、残念ながらこの企画で提案した新しいサーブ効果率は、『使える』スタッツとはいえない結果となりました。
手間暇かけて分析してきたので、結果としては不本意ではありますが、こういう結果になることは個人的にはそんなに珍しいことではありません。
改善案を考える
上手くいかなかったら、残念そこでおしまいとなるわけではありません。ここから必要なのは、上手くいかなかった原因を考えて改善案を出し、次の分析に入ります。
後は上手くいくまでこれを繰り返します。世の中に報告されている成果の大半は、この最終的に上手くいった部分なわけです。
この企画は今回で終わりの予定なので、上手くいくまでループはしませんが、いくつかの改善案を提案しておきたいと思います。
1.係数をいじくりまわす
今回はサービスエース・効果・ミスの価値をいろいろと分析してその係数を求めましたが、係数の値の組み合わせを任意に変えながら、勝敗との相関をその都度求めて、相関係数が最も高くなる組み合わせを探してもOKです。
ただし、係数を変化させることでどこまで相関が変化するのか、最適解が得られるかどうかには疑問が残ります。
2.効果の評定法を見直す
サービスエースもミスも明確な結果の記録ですが、効果だけは判定員の判断によって記録されます。この効果の定義を見直す、もしくは全く別の記録を用いれば、サーブ効果率は大きく様変わりすることになり、そこには改善の余地があると考えます。
この場合、既存の効果という記録を用いることができなくなるというデメリットもあります。
おわりに
格好よく新スタッツの提案と行きたいところでしたが、世の中そう上手くは行かないようです。
一方で、試行錯誤というのは上手くリードしてくれる先達がいないと、初学者のうちはエラーからのトライへのシフトは結構難しいと思います。
現在は、インターネット経由でデータ分析に興味を持ってやってみようという人のための環境は整ったと思いますが、トライの後にエラーが起こったところから、独学で立ち上がるのは結構大変なのではないかと思います。
この企画が、そんな迷える子羊たちの反面教師になれば幸いです。
タイトル画像:いらすとや