baseballrの代わりにsabRmetricsを使う


baseballrが更新されるまでsabRmetricsを使う。
追記:更新されました。


sabRmetricsをインストールして使う

#devtools::install_github(repo = "saberpowers/sabRmetrics")

library(parallel)
library(sabRmetrics)

# 1. コアの数を確認
num_cores <- detectCores()

# 2. クラスターの作成
cluster <- makeCluster(num_cores - 1)

# 3. データのダウンロード
data <- download_baseballsavant(start_date = "2024-04-02", 
                  end_date = "2024-11-30", 
                                cl = cluster)

# 4. クラスターの停止
stopCluster(cluster) 

※start_dateを開幕前にすると『列数が違います』と出るので注意
baseballr を使ってる人なら分かるが、1年分のデータを取得しようとするとかなり時間がかかる。
sabRmetrics なら parallel を使えば(私の環境だと)1分もかからない。(初回は結構かかる。時間をかけずに baseballr でデータを取得する方法は一応ある。)

baseballrとsabRmetricsの違い

1.列名が変えられてる列がある
例えば baseballr だと batter だが sabRmetrics だと batter_id に変えられている。詳しくは こちら の134行目から確認できる。

2.選手個人のデータは取れない
baseballr の playerid_lookup とfilter関数を使えば抽出できるのであまり問題はないと思う。


とりあえずここまで。何かあれば更新します。



いいなと思ったら応援しよう!