[Tableau] nobuViz#1 - MLB_Contract_2020-2024
nobuVizシリーズについて
Tableuaを使ったViz作成の思いや技術的な備忘録です。Tableauのビジュアル分析サイクルに沿って、苦労した・工夫した点を整理します。
ビジュアル分析のサイクル

nobViz#1: MLB_Contract_2020-2024
Task
何故MLBの契約について調査しようと思ったかの背景から。
僕は北米4大スポーツ(NFL、NHL、NBA、MLB)が好きで、MLBも大谷選手の活躍により、イチロー選手が現役時代ぶりに注目しています。ここ数十年はスター選手が各スポーツリーグやチームの収益に大きな影響を与えるため、スター選手を獲得するために、チームの経営状況を無視して法外な契約を結ぶケースが後を絶たないがため、Salary Cap(チームの年俸総額の上限を定める制度で、チーム経営の健全化が目的)と呼ばれる制度が導入されています。
ただし、MLBは1994にSalaryCap導入を図るも選手会の猛反発とストライキに遭ったため、四大スポーツ唯一SalaryCapの導入をせず、代わりにLuxury tax(贅沢税、上限以上年俸を払うチームに課せられる追加徴税)を導入しています。
※ちなみに、このストライキのおかげで僕の大好きなMichael Jordanは野球を諦めてNBAにカムバックしました。
他の四大スポー津所属するドジャーズは金満チームとして有名ですが、MLB史上最高額の7億ドルを後払いにした大谷選手の契約には驚きました。そこで今回は、Salary Capの無いMLBにおいてどのチームが贅沢税を多く払ってるのか、そもそもどのくらいの契約額が支払われているのかを調べてみることにしました。というわけで、今回のTaskは、
・MLBで最も金満なチームは?
・現在30歳の大谷選手の大型契約が注目されているが、最も契約年俸の高い年齢層は?
などMLBの契約に関するVizを作成して傾向を分析してInsightを得ることです。
Get Data
Tableau のViz作成において、個人的に最も難しいと感じるのは、このGet Data =「分析に必要な最適なデータを得る」です。
MLBのデータは様々なところで入手できます。
MLB official site: https://www.mlb.com/
Kaggle: https://www.kaggle.com/
ただし、TableauのVizに素早く取り込めるExcelやCSVファイルで、自分の欲しい最新データ~過去5年分となると、なかなか良いデータセットが見つからず、かれこれ数時間ネットサーフィンする羽目に。。
結局最も加工しなくて染みそうな下記を選びました。大谷選手の最新契約は入っていませんし、この記事を書いてる間で話題となったヤンキースのソト選手の契約ももちろん入っていませんが、今回の目的は「傾向を分析する」ことなので
Kaggle: https://www.kaggle.com/datasets/robbiefishel/mlb-player-contracts-2020-2024
データ内のチーム名は「チームの都市名+独特の略称」だったので、チーム名で手補正しました。うまくチーム名が分からないものについては、所属選手情報を調べてマッピングしたり、割と大変です。
Choose Visual Mapping & View Data
現在僕はTableau Data Saberのチャレンジ中なので、ordialで学んだことを少しでも使おうと思います。
ツリーマップ:最も選手の契約金額の合計が高いチーム=贅沢税の高いチームを把握するべく、ツリーマップを採用
ヒストグラム:契約金額の多い年齢で並べて比較するために棒グラフを採用し、色相で年俸の高低、最も高い年齢のみ合計金額を表示
パックバブル:過去5年の年俸Top3選手を示すためにバブルで表現
Develop Insight
一番契約年俸が高いのは31歳、最も契約金を支払っているのは、大谷選手の所属するLAドジャーズ、大都市Los Angeles, New York, Chicagoのチームが金満チーム上位を独占。などが分かりました。特に目新しいInsightはなく、今オフシーズンは優勝したドジャーズの選手たちの契約更改、ソト選手などスター選手のFA、日本人選手の参戦など、ますますMLB契約は面白くなりそうなので、来シーズン開幕時に再度調査したらもっと面白そうです。
Act
本当は、「どの代理人が一番高い契約を引き出しているか?」を評価したかったですが、さすがに全部の契約に携わった代理人 or スポーツエージェンシーが埋まっているデータはなく、また近年の複雑化した契約形態(複数年契約やオプションに比重を置いたもの)もあり、バシッと納得いきそうなデータが見つかりませんでした。
ただ、Vizとして成立させるためのデータ探しってのは、分析の出口を自分で狭めている気がするので、バランスが難しいですね。
それでは、また。