三振が減ればホームラン、得点が多い?2020年MLBにおける両者の相関
一昨年、MLB各チームのスタッツと得点の相関につき以下のNote記事を投稿し、多くの方に読んでいただいた。いまだにアクセスがある。
「やっぱりOPSが最強:打撃指標とチーム得点力との相関は」
https://note.com/clutchman/n/n3463670a6c9a
2020年も、2018年と同じ切り口でその数字の上書き…というのは面白くない。そこで、今回は角度を変える。テーマは「三振とホームラン」「三振と得点」。シーズンが短縮された2020年は別として、MLBでは、2019年まで12年連続で三振数が増加した。その一方で近年はいわゆる「フライボール革命」もあってホームラン数は増加傾向にあった。三振とホームランは一見比例関係に見える。
あなたは、どちらの考えだろうか?
1)チーム三振が少ない方が、確実性が上がり得点力が上がる。
2)チーム三振が多いことは、ホームランバッターが多い証。だから、三振が多い方が得点も多くなる。
2020年のMLB各チームを対象に、「三振とホームラン」「三振と得点」の相関について分析を行ってみた。ここでの私なりの仮説をまとめると、以下の通り。
・三振が少ない方がホームラン、得点も多くなる
・ただし、その相関にはいくつかグループがある
1.前提条件
MLB全チームの2020年のレギュラーシーズンのスタッツを一括して分析、NL、AL別の区分はしない。コロナ禍に見舞われ、レギュラーシーズンの試合数が原則60(一部消化できなかったチームもある)に限られた2020年は、レギュラーシーズン内の地区をまたぐ対戦がなかった点、いわゆるインターリーグの試合の割合が高かった点で、リーグ別の傾向は出にくいと考えたからだ。
なお、平均値、中央値は以下の通り。
三振 :平均値519.5、中央値522.5
ホームラン:平均値76.8、中央値76.0
得点 :平均値278.1、中央値274.5
2.単純な相関は認められない
まず、単純に、三振とホームラン、三振と得点の相関をまとめた。見ての通り、単純に計算した場合、相関はほとんどないといっていい。ごくわずかに三振と得点に負の相関があるかな???という気もしなくはないが、これもあってないようなものだ。
▲三振-ホームランの関係
▲三振-得点の関係
3.詳細な分析:グループ分けで負の相関が
ここで、前のグラフにつき、A~D(三振-ホームランはB’もある)にグループ分けすると、新たな発見があった。それぞれのグループにつき、三振とホームラン、三振と得点の負の相関が見えてくるのだ。言い換えれば、「ホームランを増やすには、得点を増やすには三振を減らしたほうがいい」ということになる。しかも、「三振-ホームラン」「三振-得点」それぞれのチームのグルーピングは類似性が高い。なお、下記グラフの赤線は中央値に相当する。
▲三振-ホームランのグループ別相関
▲三振-得点のグループ別相関
その相関式、相関係数、決定係数、さらに該当係数をまとめると以下のようになる。
▼三振-ホームランの相関
▼三振-得点の相関
特に相関が高いのが、「三振-ホームランの相関」のAグループ、Bグループで、いずれも決定係数が96%を超えている。後者は12チームが含まれている中でのこの高い相関係数を示している。さらに17チームに広げたB’のグループについても、76.2%の高い決定係数を示している。「三振-得点の相関」に関しても、B、Cグループで決定係数が84%以上と、比較的高い相関を示した。
4.追記
以上のように、4グループ別に、三振とホームラン、三振と得点に負の相関が現れた。さて、このA~Dの各グループの相違は何だろうか?フリースインガーの割合の高さということになるのだろうか?一見そうみえるが、よくわからない。
なお、三振とホームランに関しては、以下のまとまりでみることも考えられる。角度を変えた分析も面白いだろう。
各チームのデータは以下の通り。
この記事が気に入ったらサポートをしてみませんか?