見出し画像

FIVBデータの共有 FIVBパリ五輪予選 ワールドカップバレー2023 Play-by-Play データ(β)版

 以前、2023年のワールドカップバレーのデータを集計したものを公開しています。

 バレーボールのデータは、FIVBではBoxスコアという形で記録されています。これは1試合、または1セット分の各種スタッツの記録を集計してまとめたものになります。各国のリーグも呼び名は違う場合もありますが、記録として残っているのはこのBoxスコアになります。
 
 こうした記録を集めて他の人にも使えるようにしているわけですが、Boxスコアにも限界があり、例えば、レセプションが良かった時と悪かった時のスパイクの結果の違いといったデータを見ることはできません。

Play-by-Playデータ

  ここで本題に入りますが、昨年のワールドカップからBoxスコアに加えてもう1種別のデータを利用することができるようになりました。それがPlay-by-Play データになります。
 
 これは下図に示すように、誰がサーブを打って、誰がレセプションをして……というように、1プレーごとの記録になります。このデータがあればBoxスコアよりも細かい分析が可能になります。

 今回はPlay-by-Playデータについて、女子の大会の集計ができましたのでそれを例の如く下記のリンクに公開しておきました。 

 データは下図に示すOQTの所にあります。

 OQTを開くと2023のフォルダがあるので、その中に下図のようなファイルがあります。

 上の2つは先日公開したもので、下の3つが今回加えたPlay-by-Playデータになります。ファイルのサイズが大きくなり過ぎたので、Poolによってデータを分けています。PoolAは中国での大会、PoolBが日本、PoolCはポーランドで開催された大会になります。

β版データの利用にあたって

 毎度のことですが、利用の際には自己責任でご自由に使っていただいて構いません。使用の際の連絡も結構です。
 
 ただし、後程解説しますが、何分慣れないデータなのであくまでβ版の完成度であることは了承ください。
 
 また、PoolCの以下の試合はそもそもPlay-by-Playデータの掲載がありません。
 
・ITA – COL
・USA-KOR
・POL-THA
・GER-SLO
・USA-GER
 
 これに加えて、各試合のビデオチャレンジで判定が覆ったラリーは情報が抜け落ちてしまうのでこれらは欠損データとなります。

データの見方

 というわけでPlay-by-Playデータの中身を解説しておきます。データはCSVのファイルですが、エクセルで開いたものを解説していきます。
 
 最初にあげるのは試合の情報に関わる部分です。

 Poolと試合番号(Match)、日付(Day)に対戦するチーム(Team1/Team2)と何セット目かという表示(Set)、ラリー開始前の得点とラリー後の得点(Point: Before-After)という試合に関わる情報になります。
 
 1行1プレーのデータとなっているので、この辺りの情報は同じ内容が続きます。
 
 次はプレーに関する部分です。

 1行ごとにプレー内容(Play)があり、そのプレーが得点になったかどうか(Scored_Play:1が得点)に加え、関わった選手の情報、Noと選手名(Player)、所属チーム(Team)にポジション(Position)がある形です。これがPlay-by-Playデータのメインにあたる部分です。
 
 次は、試合経過に関わる部分です。

 ラリー(Rally)とはサーブから始まり、得点が入るまでのプレーを指します。開始時にはStartに1が、終了時にはEndに1が入ります。これに加え、セット(Set)の開始と終了、試合(Game)の開始と終了も同様のデータとなっています。
 
 次は今回をβ版とした理由のところで、ラインナップ情報になります。

 この図はTeam1のラインナップ1のポジションにいる選手のNoと名前(Player)とポジション(Position)の情報になります。同様のデータがラインナップ1から6まであり、当然Team2のラインナップも同様の情報があります。
 
 このデータは元々Play-by-Playデータには無いのですが、セットの開始時にスターティングラインナップの情報があったので、そこから点が入るごとにローテーションさせていくことで、プレーごとのラインナップ情報を作成しました。
 
 正直これがちゃんとできているのか自信が無くβ版のデータ扱いとしています。この後男子のデータも集計する予定なので、そこでシステムを再確認していこうと思います。もし、データを利用して不備に気づかれたら、教えていただけると助かります。
 
 次はメンバーチェンジの情報です。

 ラインナップから外れる選手(out)と入ってくる選手(in)の情報になります。1度に変更できるのは4人までなので、一応4人分のデータの欄をそれぞれのチームで用意しています。
 
 また、リベロの出入りは別枠としています。

 データの見方はメンバーチェンジと同じです。
 
 最後に、タイムアウトとビデオチャレンジです。


 タイムアウトを取ったチームに1が入ります。先ほど説明したように、ビデオチャレンジで判定が覆った場合、ラリーの情報が欠損してしまうのですが、その場合の行のプレーデータはNo Dataとしています。

まとめ

 とりあえず、β版でもいいからアップして修正していこうと決めました。男子のデータを集計したり、次の大会でもPlay-by-Playデータが利用できるようになるなど、経験を積んでいくことで洗練されていく予定です。
 
 データとしては記録の羅列で、このデータをざっと眺めても何もわからないのですが、このデータを利用してできることはBoxスコアより広がりがあります。
 
 データ元

タイトル画像:いらすとや 

いいなと思ったら応援しよう!