見出し画像

【ALGS】大会結果分析に使う専門用語解説【統計】

ALGSの結果分析においてしばしば統計学に疎い人間は分からない用語が出てきます。私が投稿する記事をある程度適切な理解の元読むために必要な用語を解説します(特別、数学の知識は要らないような説明にしましたので一部不正確な説明が存在する可能性があります)。

箱ひげ図

画像1

箱ひげ図は箱にひげが生えたような図のことを言います。基本的には、一番上の髭を最大値、箱の上端を上位25パーセントの点、箱の真ん中の太線を上位50パーセント、箱の下端を上位75パーセント、髭の下端を最小値を表します。〇は外れ値を表し、集団から大きく外れた点を表します。つまり上位G1において最大値は外れ値の〇(つまり突出して高得点)ですが、上位G2は髭の上端が最大値です。

回帰直線

画像2

回帰直線は散布図と一緒に考えられる直線で、散布された点の傾向を示す直線です。上の図では黒い直線が回帰直線です。

決定係数(R^2)

決定係数(R^2)は回帰直線がどれほど点の散布の傾向を説明できているか表す数値で、0から1の値をとります。1に近いほど回帰直線は散布をよく説明できていることになります。
R^2<0.6・・・回帰直線はうまく出来ていない
R^2>0.8・・・とてもよく出来た回帰直線
R^2>0.9・・・うまく出来過ぎていて、用いたデータに度が過ぎた選別があるか疑ってもよいレベル。

相関係数

相関係数も散布図について説明したもので、-1から1の数値をとります。相関係数が1に近ければx軸の数値が大きいとy軸の数値も大きいことを表し、-1に近ければx軸の数値が大きいとy軸の数値は小さいことを表し、0に近いとどちらでもないことを表します。

標準偏差

標準偏差はどれほど平均から点数がばらついてるかを表した数値です。例えば大会で1試合目から5試合目まで10点10点10点10点10点だったら標準偏差は0になりますが、0点10点10点4点7点のとき標準偏差は3.82になります。
点数が平均点±標準偏差の範囲に収まっていると大雑把に考えればいいです。(実際先の例では平均が6.2、標準偏差は3.82なので、大雑把にどの試合も平均±標準偏差におさまっています。)


いいなと思ったら応援しよう!