ローレンツ曲線とジニ係数 #1
株式会社リュディアです。ローレンツ曲線とジニ係数についてまとめてみたいと思います。最近はジニ係数というキーワードをメディアで見かけることが多くなりました。不平等さの指標として使われているようです。記事を見て格差がどうのこうのという議論も結構なのですが、実際にジニ係数を求めたことのある人は少ないと思いますのでやってみましょう。何でも自分でしてみることが重要です。
今回はジニ係数についてまとめる前段階としてローレンツ曲線についてまとめてみます。
参考にしたデータは厚労省から報告されている以下のものです。2018年度末の情報とのことですので注意が必要です。
この資料の中に世帯収入と世帯数の関係をヒストグラムで表したものがあります。ここから以下の表を作りました。世帯数は 50,991世帯、約 5千万世帯です。世帯年収を100万円単位の階級とした該当する世帯比率を記載しています。
この情報を基礎データとしローレンツ曲線を描画するために項目を追加した以下の表を作成しました。
追加した項目の説明を順にしていきます。
階級値
階級の中央値としました。2,000万円以上の階級値を 2,050万円としたのは問題ありです。世帯所得 2,000万以上世帯の平均値はもっと高いはずですが今回は 2,050万円とさせてください。
世帯数
世帯数を 50,991千世帯とし度数分布表の各階級の比率がわかっているので、各階級の比率 x 50,991千世帯として計算しました。
階級値 x 世帯数 = 階級の合計所得
各階級に属する世帯の所得の合計のことです。表中では所得合計と記載しています。所得の違いも言及しません。収入ではなく所得となっているのでいわゆる再分配後と考えてください。
相対度数(世帯数と所得合計)
世帯数と所得合計それぞれの相対度数です。
累積相対度数(世帯数と所得合計)
世帯数と所得合計それぞれの累積相対度数です。
次に横軸を世帯数の累積相対度数、縦軸を所得合計の累積相対度数としてグラフを作ると以下の青い曲線になります。縦軸も横軸も累積相対度数ですので範囲は 0 ~ 1 になります。
この青い曲線をローレンツ曲線 / Lorenz curve と呼びます。もともとは米国の経済学者マックス, O, ローレンツが1905年に発表したものです。富の偏在を論じる際に使われることが多いです。
今回はローレンツ曲線についてまとめました。次回はローレンツ曲線とジニ係数についてまとめます。
では、ごきげんよう。