見出し画像

[ 入門編 ] R を使って「わかる」統計! データの記述(2)平均値

入門編とは

Rを使って「わかる」統計! と題して記事を書いています。この入門編とは,それらの記事を中学生や昔数学をしたけれどもすっかり忘れてしまったひとを対象に書き直したものです。

平均値の計算

以下は,コロナ前のある中学校の1年生の体重です。

34, 37, 38, 45, 47, 52, 61

2018年5月に測定された男子中学生の体重(単位はキログラム)

7個の測定値があるので,平均値は次のように求めます。

  1. 7個の測定値 {34, 37, 38, 45, 47, 52, 61} がある。

  2. 7個の測定値 {34, 37, 38, 45, 47, 52, 61} を足し合わせる。

  3. 足し合わせた数を7で割る。

次のデータはコロナ禍でのある中学校での体重のデータです。

44, 47, 47, 53, 55

2020年5月に測定された中学生の体重(単位はキログラム)

5つ測定値があるので,次の手順で平均値を求めます。

  1. 5個の測定値 {44, 47, 47, 53, 55} がある。

  2. 5個の測定値 {44, 47, 47, 53, 55} を足し合わせる。

  3. 足し合わせた数を5で割る。

このように個々の場合で,測定値の個数は変わります。ここで,この数をアルファベットの  $${n}$$ で表現することにしましょう。場合によって数がさまざま変わるものを変数といいます。この変数を用いると,平均値の算出方法は次のように簡単に書くことができます。

  1. n 個の測定値がある。

  2. n 個の測定値を足し合わせる。

  3. 足し合わせた数を n で割る。

変数を用いることで,どのような場合にでも適応できる記述をすることができます。これを一般化といいます。

一般化

一般化をより進めてみましょう。

44, 47, 47, 53, 55

2020年5月に測定された中学生の体重(単位はキログラム)

5個の測定値があります。それぞれ具体的な数値で表現されていますが,これを変数を用いて表現すると以下のようになります。変数は変わる数と書きます。測定値は測定するたび様々な数が得られます。こういうものは変数で表します。

$$
x_{1}, x_{2}, x_{3}, x_{4}, x_{5}
$$

測定値を x という変数で表しています。右下に数字がありますが,これはそれぞれ別の測定値だとわかるように付けています。添え字といいます。5個測定値があるので,添え字も1から5まであります。

何個測定値があるのかは,場合によって異なります。今回のように5個の場合もあれば,7個も場合もあります。測定値の個数も変数として書けば,次のようになります。

$$
x_{i}
$$

ずいぶん簡単で読みやすくなりました。

この場合,変数 i は1から5の数値をとります。数が変わるので変数でしたね。さて,測定値を足し合わせる手順は次のように数式で書くことができます。

$$
x_{1} + x_{2} + x_{3} + x_{4} + x_{5}
$$

新しい記号

算数や数学では数を操作する際,いろいろな記号を使っています。数を操作するとは,1と2を足すというようなことを言いますが,この場合,記号とは「足す」,つまり「+」ですね。足す,引く,割る,掛けるなどの記号を私たちは知っています。

ここで新しい記号を追加することにしましょう。それは,全部足し合わせるという記号です。

以下は次のような操作を意味しています。

変数 i の値が最初1として,それを n まで1づつ大きくしていく,そうすると,$${x_{i}}$$の値は, $${x_{1},x_{2}, x_{3}, x_{4}, x_{5}}$$ と i がひとつ増えるたびに変わっていきます。それら$${x_{1},x_{2}, x_{3}, x_{4}, x_{5}}$$を全部足し合わせるというのがこの記号が意味しているところです。

$$
\sum_{i=1}^{n} x_i
$$

$${\sum}$$ はシグマと読みます。なぜこのような記号を使うのか。足し合わせることを英語でsummation (サメイション)といいます。その頭文字はsですが,この s,ギリシャ語ではシグマ($${\sum}$$)です。それで総和を表すのにシグマが用いられているのです。シグマはその右横にある数を足し合わせることを示す記号です。この式はどう読み上げるのか。こう読みます。「シグマ,アイ,イコール,いちから,エヌ まで、 エックスアイ」。具体的には下の式の右辺の計算をします。

$$
\sum_{i=1}^{n} x_i = x_{1} + x_{2} + x_{3} + x_{4} + x_{5}
$$

最後に足し合わせた数を n で割ると,平均値は次のように表現できます。

$$
\frac{\sum_{i=1}^{n} x_i}{n}
$$

練習

$${ x_{i} = \lbrace 1, 0, 2, 3, 2 \rbrace }$$のとき,$${\sum_{i=1}^{n} x_i}$$ を計算しなさい。

答え

$${1+0+2+3+2=8}$$ なので,8 が答えです。

$${x_{1} = \lbrace 0, 0, 2, 1, 2 \rbrace}$$ のとき,$${\frac{\sum_{i=1}^{n} x_i}{n}}$$ を計算しなさい。

答え

(不安なひとはコメント欄に答えを書き込んでみましょう)

おすすめの書籍


いいなと思ったら応援しよう!

この記事が参加している募集