見出し画像

スポーツデータを楽しむ(ラグビーワールドカップ歴代大会別 総得点推移)

こんにちは。Jackalistです。

それでは本日もスポーツデータで楽しみましょう。

そろそろラグビー以外のネタを投稿したいな

と思い、Kaggleで探してたら、またまたラグビーワールドカップの過去大会のデータに辿り着きました。折角なので確認してみたいと思います。

データの確認と下処理

いつも通り元データとデータタイプ、欠損値などを確認します。

import pandas as pd
RWC = pd.read_csv("/content/drive/MyDrive/Colab Notebooks/row_data/Rugby World Cup Results.csv")
#元データ確認
RWC.head()
#情報確認
RWC.info()

画像1

画像2

欠損値は大丈夫そうなので、"Team 1.1"とおかしくなっている列名だけ修正します。

#列名変更
RWC = RWC.rename(columns = {"Team 1.1":"Team 2"})
RWC

画像3

今回は総得点を調べたいので"Team 1 Score"と"Team 2 Score"を合計した新しい列を追加します。

#列同士の計算
RWC["Total Score"] = RWC["Team 1 Score"] + RWC["Team 2 Score"]
RWC

画像4

大丈夫そうですね。それではまとめて確認しましょう。

データをまとめてみる

歴代大会の推移なので"Year"でまとめて、"agg"関数を使い、合計、カウント、平均を確認してみます。

#歴代総得点数
RWC_Total = RWC.groupby("Year").agg(["sum","count","mean"]) .drop(["Team 1 Score","Team 2 Score"] , axis=1)
#歴代優勝国追加
RWC_Total["Winners"] =["New Zealand","Austraria","South Africa","Austraria","England","South Africa","New Zealand","New Zealand","South Africa"]
RWC_Total

歴代優勝国も追加してみました。

画像5

本日のメインテーマである総得点推移を折れ線グラフで描画します。

#x軸Y軸の交差でプロット

x = RWC_Total.index
y = RWC_Total["Total Score"]["sum"]

plt.plot(x,y,linewidth=2,linestyle="solid",marker="o")
plt.xlabel("Year",fontsize=10)
plt.ylabel("Score",fontsize=10)
#plt.xlim(1983,2023,4)
#plt.grid()
#plt.legend(fontsize=15)
plt.title("RWC Score")
plt.show()
#plt.savefig("graph.png")

画像6

まとめたデータを考察してみる

その前に前提条件として、試合数・トライの点数に関して補足します。

試合数について
1987年(第1回大会)から1995年(第3回大会)は16カ国参加の計32試合
1999年(第4回大会)から20カ国参加に変更
1999年のみフォーマットが異なり計41試合、以降計48試合
※ただし2019年は台風の影響で3試合中止の45試合
トライの点数について
1991年(第2回大会)まではトライは4点、以降5点

それでは気になった点をまとめて考察してみましょう。

総得点
・フォーマット変更後、2003年が過去最多
・2003年以降は減少傾向
・2019年は3試合少ないが過去最小、
1試合得点平均
・1991年が過去最小、フォーマット・ルール変更後だと2011年
・2003年が過去最多

総得点最多の2003年は、ラグビー界のベッカム、ジョニーウイルキンソンが得点王になり、イングランドが初優勝した大会です。
イングランドはどちらかというと、ウイルキンソンのキック主体のチームだったので、イングランドというよりも、フォーマット変更による参加国増加=今まで予選落ちしていたチームの参加=上位チームと実力差のある試合が予選で増加が、総得点最多につながったのではないかと思います。

一方で、2003年から総得点が減少傾向なのは各チームのディフェンス力向上による接戦ゲーム増加その接戦とキック技術向上によるPG(ペナルティゴール)増加、あたりが理由でしょうか。反対に、PG数は増加傾向になっていたと記憶してます。

あとはチーム別総得点を確認しないとなんとも言えませんが、ルール改正なども影響してるかもしれませんね。

見る側からすると、接戦する試合が増えるのは良いことですが、一方でトライ数が減って、キック主体のゲームが増えるのはあまり良くないですね。
この辺はワールドラグビーが、前述のルール改正を毎年、定期的に見直しながら、アタック有利、ディフェンス有利のルールをうまくコントロールしている印象を受けます。

いずれにしても2023年はどんな大会になるか今から楽しみです。

それでは本日もご覧いただきありがとうございました。

良ければモチベーション維持になるので、フォロー、スキを頂けるとめちゃくちゃ嬉しいです。

この記事が気に入ったらサポートをしてみませんか?