baseballrの代わりにsabRmetricsを使う
baseballrが更新されるまでsabRmetricsを使う。
追記:更新されました。
Yesterday, Baseball Savant released pitcher arm angle on a pitch-by-pitch basis!
— Scott Powers (@saberpowers) November 14, 2024
You can download these data using the updated download_baseballsavant() function in the new v1.0.4 release of the sabRmetrics R package.https://t.co/nCwFI8WjgE https://t.co/721oftUyxD
sabRmetricsをインストールして使う
#devtools::install_github(repo = "saberpowers/sabRmetrics")
library(parallel)
library(sabRmetrics)
# 1. コアの数を確認
num_cores <- detectCores()
# 2. クラスターの作成
cluster <- makeCluster(num_cores - 1)
# 3. データのダウンロード
data <- download_baseballsavant(start_date = "2024-04-02",
end_date = "2024-11-30",
cl = cluster)
# 4. クラスターの停止
stopCluster(cluster)
※start_dateを開幕前にすると『列数が違います』と出るので注意
baseballr を使ってる人なら分かるが、1年分のデータを取得しようとするとかなり時間がかかる。
sabRmetrics なら parallel を使えば(私の環境だと)1分もかからない。(初回は結構かかる。時間をかけずに baseballr でデータを取得する方法は一応ある。)
baseballrとsabRmetricsの違い
1.列名が変えられてる列がある
例えば baseballr だと batter だが sabRmetrics だと batter_id に変えられている。詳しくは こちら の134行目から確認できる。
2.選手個人のデータは取れない
baseballr の playerid_lookup とfilter関数を使えば抽出できるのであまり問題はないと思う。
とりあえずここまで。何かあれば更新します。