ローレンツ曲線とジニ係数 #2
株式会社リュディアです。引き続きローレンツ曲線とジニ係数についてまとめてみたいと思います。前回の記事で2018年度の世帯ごとの所得分布のローレンツ曲線を描画しました。
今回はジニ係数です。今回は一般論としてローレンツ曲線とジニ係数についてまとめてみます。以下の図をみてください。ローレンツ曲線 L(F) と均等分配線を記載しています。均等分配線は45度線とも呼びますが、この記事では均等分配線とします。
均等分配線は原点 O(0, 0) と A( 1.0, 1.0 ) を結んだ直線のことです。均等分配線の意味するところは全世帯が同じ所得であるということです。もし全世帯の所得が同じであればローレンツ曲線は均等分配線に重なります。
ここで均等分配線とローレンツ曲線とのずれを扱うことで世帯所得の偏りを扱えるのではないか、と考え導入されたのがジニ係数です。英語表記は Gini Coefficient で1936年にイタリアの統計学者コッラド・ジニによって考案されました。具体的には以下の図に記載した斜線部の面積を△ OAB の面積で割った値をジニ係数とします。
しかし斜線部の面積を求めるのは難しいですよね。そこで以下のように考えます。まず△OAB の面積は以下のように計算できます。
次にローレンツ曲線と X 軸で挟まれた領域の面積を 0 ~ 1.0 の範囲で求めることを考えます。この面積は以下の積分で求められます。
この2つの式を考慮するとジニ係数 G は次の数式で求められることがわかります。
つまりローレンツ曲線の積分値が求まればジニ係数を求められます。しかしローレンツ曲線は特殊な例外を除き積分可能な方程式での記載は不可能です。
これについては次回の記事でまとめたいと思います。
では、ごきげんよう。