見出し画像

スポーツデータで楽しむ(ラグビーワールドカップ2019④ 出場チーム別比較編)

チーム別比較をしてみる

前回使った”group by”で、次はチーム別に各項目を比較してみたいと思います。
その前に、いつもの基本情報と、参加20チームの紹介です。

それでは早速、やっていきましょう。

#チーム別基本情報
RWC2019.groupby("team").describe()

daecribe()を使うと、年齢・身長・体重・キャップ数のmaxやminなど各項目が横長に出てきます。
これだとよく分からず、比較できないですね。mean(平均値)にフォーカスしてみます。

#チーム別比較mean
RWC2019.groupby("team").mean()

面白い数字が出てきたので、早速確認していきましょう。

チーム別平均年齢 -年齢ではなく結果が大事-

年齢からいきましょう。
先程のcodeから、取り上げたい項目を”[ ]”で指定して、sort_valuesを用いて昇順降順をかけていきます。ちなみに1行で書きたかったけど出来ませんでした。勉強が足りませんね。

#チーム別比較
RWC2019_team_mean = RWC2019.groupby("team").mean()
pd.DataFrame(RWC2019_team_mean["age"].sort_values(ascending=True))

#1行で↓みたいにやりたかったけど出来なかった
#RWC2019.groupby("team"["age"]).mean().sort_values("age",ascending=False)

#平均年齢(昇順)
JPN:4番目に高い、FRAフランス3番目、ENGイングランド4番目、ARGアルゼンチン5番目に若い

日本の平均年齢が高いのは、前回(2015年大会)終了時にも指摘されていた気がします。ただ今回も結果を出しました。結果が1番大事です。次回もジェイミーのチーム作りに期待したいです。
逆にフランス、イングランド、アルゼンチンは、平均年齢が若く、前回記事でやった通り、若手で40キャップ以上取っている選手が多いです。
日本、この3チームもフランス大会で注目ですね。

チーム別平均身長 -ニュージーランドはやはりでかい-

続いて身長です。
ちなみにcodeは、項目をかえるだけなので省略します。

#平均身長(降順)
ニュージーランド、オーストラリアがTOP2
185cm以下は、4チームのみ
日本は2番目に低い

日本外国籍選手を除けば、おそらく平均も1cm程度下がるはずです。
そう考えると、本当日本代表はよくやりましたよね。素晴らしいです。
過去大会と比較して選手の大型化がどの程度、進んでいるかは元データがゲット出来次第、やってみたいと思います。

チーム別平均体重 -トンガは重すぎなのか?-

続いて体重です。

#平均体重 (降順)
JPN:5番目に軽い、100キロ超えている
TONトンガ:108.7キロ、重すぎな気が。。
URYウルグアイ:94.7キロとダントツで軽い

前の記事で紹介した151キロベンタメイフナ選手を筆頭に、トンガは後半から歩いている選手が多いのがいつも気になっています。
ちなみにトンガ肥満大国でも有名ですが、男女とも平均体重が95キロというデータもありました。
そう考えると、逆に平均108キロはむしろ軽い?というか、きちんと絞っているのかな?と思いました。
恐るべしトンガ。。

ちなみにウルグアイが94.7キロとダントツで軽い理由の一つに、プロ化の遅れが関係していると思います。
2015年大会では登録選手31名中27名が、医者やグラフィックデザイナーなどのアマチュアだったことも、彼らの特徴です。
身体作りもスキルの一つです。プロでやってない以上、他チームから遅れを取ってしまいます。
ただそんな彼らが今回フィジーを破った試合は痛快でした。個人的に今大会のベストマッチです。

チーム別平均キャップ数 -トンガ・フィジー・サモアの弱体化との関係は?-

最後にキャップ数です。
(キャップ数とは国際大会の出場回数です)

#平均キャップ (降順)
FIJIフィジー,TONトンガ,WSAサモアの南太平洋島国3チームが、ワースト4
日本は6番目に少ない
ジョージアが2番目に多い

キャップ数に関しては前回の記事で取り上げました。
多い少ない=良し悪しではないですが、今回、南太平洋島国3チームの結果があまり振るわなかった理由の1つに、キャップ数(経験の差)が少なかったのがあると考えています。

では何故、キャップ数が少ないのか?
他国への流失、資金難、代表メンバー辞退
など色んな問題が絡んでいます。この問題について、良記事を発見したのでぜひご覧ください。

まとめ

今回は新しく学んだsort_valuesを使って、チーム別に各項目を比較してみました。
次回は、ポジション別比較をみていきたいと思います。

何をやっても3日坊主なのですが、今回note4日目に突入しました。
ラグビーワールドカップでネタはつきないので、なんとか目標の10投稿はいきそうですが、あまり単純なpython(というか、ただの比較演算子...というか、前回も同じこと言っていた気が...)を使い続けても意味ないので、次回から徐々に新しいことを取り入れていきたいと思います。

もし良ければ、かなりのモチベーション維持になるので、スキとフォローを頂けると大変嬉しいです。

この記事が気に入ったらサポートをしてみませんか?