
MLBのデータからバットの加速度を考える
明けましておめでとうございます。今回のnoteは中島幸祐(新4年/開成)がお届けします。7ヶ月前に始まったアナリストnoteですが、仲間たちが面白い記事をたくさん書いてくれていて嬉しい限りです。自分もサボってばかりいられないな、ということで正月休みを利用して書いております。
まえがき
さて、最近弊部ではBlastというバッティングに関する計測機器の活用を進めています。バットのグリップにセンサーをつけるとバットスピードやスイング時間をはじめとする多くのデータを取得できる優れもので、部員たちも日々その指標を見ながらバッティングの改善に励んでいます。
こうした取り組みを始めると、当然気になってくるのが「結局どの指標が重要なのか」です。Blastでは13項目の数値(mizuno公式サイトより)を測定することができますが、これらの指標の中には難解なものや互いがトレードオフの関係にあるものもあり見ておく数値を決めておかないと迷走しかねません。
定説では「バットスピード」が最も重要とされており、打球速度との相関を示す研究も多数報告されています。しかし、バッティング練習で取ったデータを見ているとバットスピードは高いが試合での指標には結びつかない選手、逆にバットスピードは低いものの試合で活躍する選手もおりそれだけを重視するわけにもいかなさそうです。他の指標も見ていたところ、体の回転によるバットの加速の大きさ(初動)という指標が試合での活躍と関連していそうだと感じました。公式サイトによれば、「ダウンスイングからバットが回転するタイミングでどれだけ加速するか」を測るもののようです。要するに加速度ですね。
さらに、Blastのデータを扱っているいくつかのnote記事でも加速度の重要性が指摘されていました。
こちらのnoteでは加速度が運動連鎖と関連している可能性にも言及しており、さらにBlast本社も加速度を重要視している旨が記されています。
また、こちらのnoteは加速度/バットスピードを共に考慮した総合指標である「パワー」の重要性に触れています。
というわけで、「加速度」の重要性を大規模なデータを用いて検証してみようというのがこのnoteの趣旨です。弊部のバッティング練習のデータも使いたいところですが、実戦のデータを利用したいこととデータ数が豊富なことの2点から今回はMLBのデータを使用していきます。
手法
使用データ
2024年のMLB公式戦データ709510球分を、Statcastからダウンロードして使用しました。
加速度とスイング時間の算出
MLBのstatcastに追加されたバットスピード関係のメトリクスから加速度やスイング時間を簡易的に算出して使用します。提供されている「bat_speed(=バットの最大スピード)」,「swing_length(スイング軌道の長さ)」から以下の過程により算出します。なお、このプロセスは以下のサイトを参考にしています。
以下の仮定を置く:
加速度が一定である。
スイングの開始時(バットが動き出す瞬間)は速度がゼロである。
スイングの終わり(バットがボールに当たる瞬間)の最大速度に達する。
スイングは加速期間と同じ時間で減速する(つまり対称的な運動である)。
また、以下のように定義する:
$${v_{\text{max}}}$$ = スイングの最大速度(メートル毎秒)
$${a}$$ = 加速度(メートル毎秒毎秒)
$${d}$$ = スイング軌道の長さ
このとき、
$${ v_{\text{max}}^2 = 2ad}$$
上記の式を加速度 $${a}$$ について解くと
$${a = \frac{v_{\text{max}}^2}{2d}}$$
Blastの表記に合わせてG単位で表現するため、
$${a_G = \frac{a}{g} = \frac{v_{\text{max}}^2}{2d \cdot g}}$$
また、スイング時間は以下のように現される:
$${T = \frac{v_{\text{max}}}{a}}$$
先ほどの加速度$${a}$$を用いて、
$${T = \frac{2d}{v_{\text{max}}}}$$
パーセンタイルの算出と相関係数の計算
スイングごとのデータを各選手のデータに変換し、バットスピード/スイング軌道長/加速度/スイング時間に対して25,50,75,95の各パーセンタイルと平均値を算出します。また、選手ごとの空振り率(全体),95マイル以上空振り率,三振率,四球率,長打率,打球速度(ave,25,50,75,95)も同時に算出します(これらの指標を選んだ理由は下に列挙します)。この時、打席数が100に満たない選手を除外します。その後、これらの指標全体に対する相関行列を作成します。
指標の選出理由/結果の予想
空振り率・三振率・四球率 加速度が高ければスイングするかどうかを決めるまでの猶予が伸びるため相関が高く出そう。
95マイル以上空振り率 加速度の高さはホームベース到達時間が短い速球と対峙するときに真価を発揮するのでは?という思いつき。
長打率/打球速度 加速度の算出にバットスピードを使っているわけなので、当然相関は高くなるでしょうという確認。
結果
加速度/スイング時間/バットスピードランキング
せっかくMLBのデータを使ったので、それぞれの指標の上位10人を紹介していきます。(全て中央値)
バットスピード

ジャンカルロ・スタントン、オニール・クルーズ、アーロン・ジャッジ、ロナルド・アクーニャJr.といった有名選手たちの名前が並びます。上位選手の長打率、ハードヒット率共に高めです。スイング時間は0.13~0.145程度に位置する選手が多いようです。
加速度

こちらもハードヒット率高めです。バットスピードに比してハードヒットが多く出ている選手は加速度が高いのかも…? オニール・クルーズは唯一バットスピード・加速度共にトップ3にランクイン。
1位に輝いたマット・ウォルナーはツインズの外野手。Savantではバットスピード・肩の強さが共にトップクラスの値を記録しており、とんでもない身体能力を持っているようです。
スイング時間

こちらのランキングには、ルイス・アラエスなどのバットスピードは遅いもののスイング軌道は短い選手たちがランクイン。ただ、どうしてもそういったタイプのハードヒット率は低くなってしまいます。意外だったのはドジャースのキャッチャー、オースティン・バーンズ。守備のイメージが強かったですが、コンパクトなバッティングも魅力のようです。
1位に輝いたのはジャイアンツの外野手、エリオット・ラモス。Savantを見る限りストレートに強い選手のようです。高い加速度ゆえに速球に振り負けずに打っていけるのかもしれません。
要約統計
ここではバッターごとに分割する前のスイング全体を見ていきます。
バットスピード

スイング時間

加速度

それぞれのボリュームゾーンは、バットスピードが70マイル(=112km)近辺,スイング時間が0.14秒近辺,加速度が25G近辺となりました。
mizunoのnote(下記参照)によればMLBレベルのスイング時間は0.13~0.17秒、加速度は大学生レベルで13~35Gとのことなので、大体うまく近似できていると思われます。
相関行列

雑にカラム数を増やして作ったせいでめちゃくちゃ小さくなってしまいました。メインコンテンツは下の段です。
なお、画像中のswing_time_p25は短い方から数えてしまっているので正しくは75パーセンタイルになります。
考察

全体的に加速度出した意味??って感じになっています。とりあえず指標ごとに見ていきます。
空振り率/三振率
バットスピード、スイング軌道長共に相関が強いです。速く,長いスイングをするほど空振りしやすいのは直感的に理解できます。加速度はやや相関が弱まっています。意外だったのはスイング時間との相関がほぼないことです。もっと綺麗な逆相関が出るかと思っていましたが、最も大きくて相関係数は0.08という結果になりました。参考までに散布図も貼っておきます。

おそらくこうなった理由はMLBのレベルの高さだと思います。大学の野球部を見ている体感だとスイング時間が0.16秒を超えるかどうかがキーポイントだと感じていますが、MLBには0.16秒以上かけてスイングする選手がほぼいません。一定レベルを超えると、あえてスイング時間を短縮しに行く意義は薄いかも…?
ただ、逆に0.15以上のスイング時間でMLBで生き残れている選手には生存バイアスがかかっている(=何らかの別の要素がとんでもなく優れている)可能性もあるのでそうと言い切るのも危険かもしれません。
アラエスみたいな選手が左下にきてスタントンみたいな選手は右上に行くんだろうなーと思ってやっていましたが、実際に2人は思っていた位置にきたものの他の選手には当てはまりませんでした。
四球率
どの指標ともほぼ相関がありません。加速度を含むスイング系の指標がPlate Disciplineに与える影響は少ないといって良さそうです。本当はO-swing%なども調べないとそう言えないんですが処理がめんどくさすぎて諦めてしまいました…
長打率・ハードヒット率・打球速度
ハードヒット率/打球速度と加速度/バットスピードの相関が強めです。ここは想定していた通りでした。最も相関が強いのは95パーセンタイルの打球速度ですね。一応それぞれの散布図も。普通に線形気味です。


スイング時間とは弱い逆相関になっています。(=スイング時間が長くなるほど少しハードヒット率や打速も下がる) 短い時間で振ったとしても、打球の強さが失われることはなさそうです。
この分析の限界・課題
そろそろ筆者の体力が限界に近づいてきたので、ここからは箇条書きで簡単にまとめます。
xwOBAとかxwOBAconで出せばスイング時間との相関がちょっと強くなったかも?
なんとなく数値があっていそうなのでスルーしたが、バットの動きを等加速度で近似して本当に大丈夫?
コースによって打者のスイングの仕方は変わるので、分けた方がより精緻な分析ができそう(9分割にせよ3分割にせよ)
まとめ
MLBのスイングスピードとスイング軌道長から大体合っていそうな加速度とスイング時間を算出できる
スイング時間を使うと、アラエスのようなコンパクトにスイングするタイプも評価できる
スイング時間/加速度のPlate Disciplineへの影響は非常に限定的、ただしMLBのレベルの高さゆえの可能性もある
打球速度やハードヒット率との相関は強いが、これらを予測/評価する場合はスイングスピードをそのまま使った方が当てはまりが良い
以上になります。最後までお読みいただきありがとうございました!
はしがき
考察を書いていて妙に納得したのですが、人間の反応速度が最速でも0.1秒であることを考えると、0.01秒ボールを長く見られたくらいで劇的に選球眼がよくなることはないですよね。選球眼に対しては、バットトラッキング以外の側面からアプローチした方が筋が良さそうです。
スイング時間のランキングを出したところあたりまでは幸せでした。ついにアラエスのバッティングの秘訣が分かったぞ、とか思っていました。
アラエスは軌道の短さ的に加速度が相当高いと予想していましたが意外とそうでもなかったです(22.5G)。東大で加速度がトップの選手と同じくらいでした。
noteのプレビューが増えるであろう三が日中に書き上げたかったのですが、気づいたら1/4の午前7時になっていました。
気づいた方もいるかもしれませんが、記事を通して空振り率が"empty swing rate"になってしまっています。chatGPTの造語でした。Googleで検索したら誰も乗っていないブランコの画像しか出てきませんでした。
分析に使用したコードを添付します。非常に汚いですが参考になる部分があれば幸いです。