見出し画像

スポーツデータで楽しむ(ラグビーW杯2019③フランス2023展望編)

1.年齢・キャップ数のヒストグラム

前回に続いて、年齢・キャップ数についてもう少し深堀りしてみましょう。
まずはいつも通り、基本情報から再確認します。
前回同様、キャップ数の解説も貼っておきます。

前回書き忘れましたが、pidは選手に紐づく識別番号のようなものなので、ここでは無視してください。

まずは、年齢とキャップ数のヒストグラムを確認します。

#年齢ヒストグラム
plt.hist(RWC2019["age"],color="indianred")

#キャップ数ヒストグラム
plt.hist(RWC2019["caps"],alpha=0.5, color= 'c')

キャップ数に注目してみます。
上図arrayを確認すると、98cap以上の選手が15人(98-112cap:7人、112-126cap:6人、126-140cap:2人)しかいません。

基本情報を見ると、全出場選手620人の平均が29.9cap75%が43cap以内に収まっていることが分かります。

ラグビーには、長年国を背負って戦い続ける選手へのリスペクトを表すため、100cap達成試合に、該当選手が1人だけ先にグランドに入場し観客・両チームで祝う文化があります。

2.経験豊富な100cap以上の選手は13人

キャップ数・年齢の散布図に100capで横線を引いてみます。

#100capに横線追加
caps = RWC2019["caps"]
age = RWC2019["age"]
plt.scatter(age,caps)
plt.hlines(100,18, 40, "red", linestyle="solid")

100cap以上の選手の内訳を確認してみます。

#Cap100以上の選手
caps_over100 = RWC2019.query("caps >= 100")
pd.DataFrame(caps_over100)

この13名の内、オーストラリア・ニュージーランドの4選手が、ワールドカップ開幕までに日本国内チームでプレー経験がありました。
こうした経験豊富な外国人選手が、日本人選手に大きく影響を与えますし、リーグ全体、引いては日本代表のレベルアップにも繋がったと思います。
来年も続々とビッグネームの選手が来日するので期待したいですね。

3.年齢・キャップ数から見る、ワールドカップ2023 in フランスの展望

最後に年齢・キャップ数から今後の展望について考察してみましょう。

次回のフランスワールドカップまで残り3年をすでに切りました。来週には組み合わせ抽選会が控えており、コロナの影響もありますが、来年からチーム作りが本格的に始まってきます。

どんな競技でもチーム作りにおいて、核となる選手(コアメンバー)が必要になります。今回のテーマに沿って、年齢・キャップ数からコアメンバーになりそうな選手を定義してみます。

・前回大会(日本大会)を経験している
・前回大会(日本大会)時点で年齢が28歳未満である
・キャップ数が40以上既にある

年齢を28歳未満にした理由ですが、日本大会の平均年齢より若く、2023で31歳以下と丁度、選手としてピークを迎える時期まで、ということで設定してみました。
ラグビーが詳しい方からは、
「そんなんポジション毎によって違うわ」「フロントロー(スクラムを最前列で組むポジション)は、30歳からが始まりです」
というご意見がありそうですが、一旦ここでは一律でやってみます。

キャップ数を40以上にした理由ですが、前日本代表監督エディージョーンズが就任当初よくインタビューで公言していた、

「W杯で結果を残すためには一人40キャップ(計600キャップ)が必要」

を根拠に設定してみました。
日本大会で既に40キャップ以上=次回大会では60-80キャップ前後の経験値を見込める選手=計600キャップの中心となる選手という考え方です。

長くなりましたが、早速、該当選手について確認してみます。
まずは散布図からです。この4分割した左上のゾーンが該当選手です。

#横線 40キャップ以上, 縦線 28歳未満
caps = RWC2019["caps"]
age = RWC2019["age"]
plt.scatter(age,caps)
plt.hlines(40,18, 40, "red", linestyle="solid")
plt.vlines(28,0, 150, "red", linestyle="solid")

さて人数はどの程度いるのでしょうか。

#40キャップ以上、28歳未満の選手数
age_caps_future = RWC2019.query("age < 28 and caps >=40")
age_caps_future.count()

620名中、39名でした。少し人数が多いので、個別名は省略します。
pythonのDataFrameをnoteに埋め込みできたら便利ですね。。

ということで最後に、個別名でなくチーム別にみてみましょう。

#上記の国別人数
age_caps_future.groupby('team')[["pid"]].count().sort_values("pid",ascending=False)

面白い数字が出てきましたね。気になったとこピックアップします。

・日本大会参加20チーム中13チームに該当選手がいる
・日本大会優勝のRSA(南アフリカ)が7名で1番多い
・日本チームには1人も該当選手がいない
・日本大会ベスト8で日本チーム以外は1人以上いる

せっかくなので、30歳未満、40キャップ以上でも確認してみます。

日本いませんねー。アルゼンチンがトップで、エディージョーンズ率いるイングランドが2番目になりました。

フランス大会まで、この該当選手たちがどのような活躍をして、チームに影響を与えていくのか、引き続きウォッチしていきたいと思います。

4.まとめ

言うまでもなく、年齢・キャップ数だけで、コアメンバーを決めることも、展望を細かく語ることもできません。
ただこの2項目をpythonでいじるだけで、色々と分析できましたね。

次回からは、チーム別・ポジション別の切り口でさらに深堀りしてみます。

もしよかったら、モチベーション維持になるので、スキを頂けると嬉しいです。

この記事が気に入ったらサポートをしてみませんか?