
Jリーグデータ分析31 チームスタイル指標とクラスターの巻
いつものことながらFootball LABさんからデータを拝借しました。
対象データは2022シーズンJ1リーグです。
今回はチームスタイル指標(指数)を使います。
チーム別の数字は下記の通りです。

上記の数字を使いクラスター分析を行いました。
樹形図は下記の通りです。

赤線で区切った通り、5つのクラスターに分類しました。
クラスターごとのチームは下記の通りです。

クラスターごとに各指標の重心を求めました。結果は下記の通りです。

赤色のセルは60以上の数字の項目で非常に特徴的な指標です。緑色のセルは55~60までの数字で、ピンク色のセルほどではありませんが特徴のある指標です。
本来ならば40以下や40~45のセルも色付けするべきではありますが、今回は攻撃に特化していますので小さい数字は敢えて無視します。
赤色のセルや緑色のセルの状況から各クラスターの名前を下記の通り命名しました。
クラスター1・・・・ポゼッション型
クラスター2・・・・ショートカウンター型
クラスター3・・・・左サイドロングカウンター型
クラスター4・・・・非攻撃型
クラスター5・・・・攻撃型
クラスターごとに指数と順位の平均値を求めました。上表の右端です。
クラスターごとの指数と順位を可視化したものが下図です。

攻撃型が最も順位が高く、非攻撃型が最も順位が低いです。
攻撃型と非攻撃型の間に3つのクラスターがあります。クラスターの型(特徴)により順位や指数に差が生じています。
攻撃型は全体的に全ての指標の数字は高いのですが、右サイド攻撃・セットプレー・ショートカウンターが高いことも特徴ですので付け加えておきます。
クラスターごとではなく、チーム別に指数と順位を示した図を下記に示します。

クラスターごとの決定係数と比べると、チームごとの決定係数はかなり低いです。図で見た通りバラツキも大きいです。
クラスター分析をすることで特徴を上手くまとめることが出来たと思います。