大阪市の人口データで統計量を扱う #1
株式会社リュディアです。今回は大阪市の人口データを使って統計量を扱ってみます。
大阪市の人口データは以下のものを使っています。この中から区単位の人口情報を使って統計量を計算してみます。元データは 2019, 11月から 2020, 10月のデータで大阪市が公表しているものです。
人口データから区単位の人口を表にしてみました。
以前に代表値といろいろな平均と題してまとめを作っていますので、今回はその値を求めてみましょう。計算式は代表値といろいろな平均を参照してください。最初に雰囲気をつかむために棒グラフにしてみました。グラフにしてみると分布の隔たりが大きいことがわかりますね。例えば最小の此花区と最大の平野区では約 3 倍の人口差があります。
算術平均
まず算術平均を求めてみます。エクセルの AVERAGE 関数を使いました。計算すると 114,625 となりました。算術平均を使って 24区の人口、つまり24倍すると 279万人となります。
幾何平均
次に幾何平均を求めてみます。人口分布で幾何平均を求める意味は無いのですが練習と思ってお付き合いください。エクセルのGEOMEAN 関数を使いました。109,080 となりました。幾何平均を使って24区の人口、つまり24倍すると 262万人となります。
調和平均
最後に調和平均を求めてみます。こちらも人口分布に対して調和平均を求める意味はありません。エクセルのHARMEAN 関数を使いました。103,948 となりました。調和平均を使って24区の人口、つまり24倍すると249万人となります。
中間値
次に代表値として中間値も求めてみましょう。エクセルのMEDIAN 関数を使いました。107,798 となりました。中間値を使って24区の人口、つまり24倍すると 259万人となります。
ここで平均値に関して以下のことが常に成り立つことを意識しておいてください。これはデータの種類に依存しません。実際、それぞれの平均値を使って 24 区の人口を求めたときに以下の関係が成立していることを確認してください。
算術平均 ≥ 幾何平均 ≥ 調和平均
今回は大阪市の区単位の人口という具体的なデータを使って代表値である平均値と中間値を求めてみました。また平均値については練習としていろいろな平均値を求めてみました。
では、ごきげんよう。