
R を使って,「わかる」統計!合格!統計検定4級 データの記述(3)中央値
中央値の計算
中央値とは,測定値を小さい値から大きい値へ並び替えたとき,中央にくる測定値のことをいいます。
以下は,コロナ前のある中学校の1年生の体重です。このデータの中央値を求めましょう。
34, 37, 38, 45, 47, 52, 61
7個の測定値があれば,真ん中は4番目です。この場合,中央値は 45 です。
一般化
それでは,中央値の算出を一般化しましょう。
測定値を変数 n であらわします。
n = 1 の場合
測定値が1個の場合の中央値を考えます。測定値も変数にしましょう。
$${x_{1}}$$
測定値は1個しかありません。中央に来る測定値は $${x_{1}}$$ になります。
n = 1 の場合,中央値に来る測定値は $${x_{1}}$$
n=3 の場合
測定値が偶数の場合,つまり,n=2, n=4, n=6 などの場合は,中央に来る測定値がありません。この場合はどのように中央値を算出するかは後ほど考えましょう。とりあえず,考えやすい,奇数,n=3 の場合を考えましょう。
$${x_{1}, x_{2}, x_{3}}$$
n = 3 の場合,中央値に来る測定値は $${x_{2}}$$
であることは,すぐわかりますね。
n=5 の場合
n=5,つまり以下の場合を考えましょう。
$${x_{1}, x_{2}, x_{3}, x_{4}, x_{5}}$$
n = 3 の場合,中央値に来る測定値は $${x_{3}}$$
となります。
規則性をみつける
これまでの3つの場合を並べて眺めてみましょう。
n = 1 の場合,中央値に来る測定値は $${x_{1}}$$,添え字は 1
n = 3 の場合,中央値に来る測定値は $${x_{2}}$$,添え字は 2
n = 5 の場合,中央値に来る測定値は $${x_{3}}$$,添え字は 3
ここで,変数 n を与えたら,中央値に来る測定値の添え字( 例えば,$${x_{1}}$$の1のこと)が何になるか教えてくれる式を考えてみましょう。
例えば,次のような式を考えることができます。他の式を考えることも,もちろんできます。
$${\frac{n+1}{2}}$$
変数 n に好きな数,つまり測定値の数を入れることで,中央値に来る測定値の添え字の数字を知ることができます。
測定値が奇数の場合は,次のように中央値を求めることができます。
測定値が奇数の場合,$${x_{\frac{n+1}{2}}}$$
次に,測定値が偶数の場合を考えていきましょう。
n=2 の場合
次のような場合です。
$${x_{1}, x_{2}}$$
この場合,中央に来る測定値がありません。仕方がないので,中央値は,$${x_{1}}$$ と$${x_{2}}$$ の間にあると考えることにします。仮に,次のように求めることにします。
$${\frac{x_{1} + x_{2}}{2}}$$
n = 2 の場合,中央値に来る測定値は $${\frac{x_{1} + x_{2}}{2}}$$
n=4 の場合
次のような場合です。
$${x_{1}, x_{2}, x_{3}, x_{4}}$$
n=2 と同様,次のように中央値を求めます。
$${\frac{x_{2} + x_{3}}{2}}$$
n = 4 の場合,中央値に来る測定値は $${\frac{x_{2} + x_{3}}{2}}$$
n=6 の場合
次のような場合です。
$${x_{1}, x_{2}, x_{3}, x_{4}, x_{5}, x_{6}}$$
n=2, n=4 と同様,次のように中央値を求めます。
$${\frac{x_{3} + x_{4}}{2}}$$
n = 6 の場合,中央値に来る測定値は $${\frac{x_{3} + x_{4}}{2}}$$
規則性をみつける
再び,これまでの場合を書き出してみましょう。
n = 2 の場合,中央値に来る測定値は $${\frac{x_{1} + x_{2}}{2}}$$
n = 4 の場合,中央値に来る測定値は $${\frac{x_{2} + x_{3}}{2}}$$
n = 6 の場合,中央値に来る測定値は $${\frac{x_{3} + x_{4}}{2}}$$
規則性を見出すことはできましたか。測定値 n が偶数の場合,n から中央値は次のように求めることができそうです。
測定値が偶数の場合,$${\frac{x_{\frac{n}{2}} + x_{\frac{n}{2}+1}}{2}}$$
まとめ
以上をまとめると,中央値の求め方は次のように一般化できることがわかります。
測定値が奇数の場合,$${x_{\frac{n+1}{2}}}$$
測定値が偶数の場合,$${\frac{x_{\frac{n}{2}} + x_{\frac{n}{2}+1}}{2}}$$
特にこの式を覚える必要はありません。中央値は測定値を小さい順に並べたとき,真ん中にくる測定値だと覚えておくだけで十分です。
練習
$${ \lbrace 0, 1, 2, 4, 5 \rbrace }$$ のとき,中央値を計算しなさい。
答え
測定値の数は 5 です。$${ \frac{5+1}{2}=3}$$ なので,3番目に来る 2 が答えです。
$${ \lbrace 1, 2, 0, 3,5 \rbrace }$$ のとき,中央値を計算しなさい。
答え
(不安なひとはコメント欄に答えを書き込んでみましょう)
おすすめの書籍
説明がとても丁寧で,あれ,なんでこうなるのかなと不安になることが少ない教科書です。難しいなと思うところもあるでしょうが,ただただ暗記したり手順を覚えているだけで,なんだか統計ってよくわからないなと思っているひとは,何度も読めば,きっと,買ってよかった,読んでよかったと思える,とてもよい一冊です。