【格差・貧困についての論文を読む#2】

格差・貧困と一言で言っても、様々な問題があります。

前回は、初回ということもあったので、現状の格差を数値で知ろうと”全体”から入りましたが、今回からはより具体的なテーマに絞って検討していきたいと思います。

格差・貧困として、最も私が「なんとかしたい」と思うのは、”子どもの格差・貧困”です。
5年くらい前の調査ですが、”今を生きる若者の意識”として、内閣府が公表したものがあります。

それによると、いまの若者(ここでは13~29歳)は、自己肯定感や意欲が諸外国に比べてとても低く、社会への参加意識や将来の希望を持っていないという残念な結果になっていました。

勿論、アンケート調査なので、「あまり、”自分に長所がある”とか答えるのは恥ずかしい」と謙虚な思いもあったのかもしれません。
しかし、”自国民であることに誇りを持っている”や”親から大切にされている”といった質問では、諸外国と同程度かより高い結果を示しているところをみると、本当に”自分なんて”と思っている子ども・若者が多いのではないでしょうか。

そこで、”子どもの格差・貧困”について、どの様な実態があるのか・自己肯定感や意欲とはどう関係するのか・どんな取り組みが有効なのかを様々な論文等から読み解いていきたいと思います。

今回は、”子どもの格差・貧困”について、統計的なデータから現状を把握するために、こちらの論文を読みました。

都道府県別の子どもの貧困率の要因分析
(鈴木 孝弘, 田辺 和俊)

鈴木先生・田辺先生は、格差・貧困の論文を多く共同で書かれているようです。様々なデータを元に、格差・貧困へアプローチされており、とても読み応えがあります。

この論文でも、都道府県別の”子どもの貧困率”を目的変数・様々な統計データを説明変数として統計的に説明するということをされています。

ぜひ、1度講演等でお話しをお聞きしてみたいです。

子どもの貧困率(目的変数)

まず、そもそも子どもの貧困率とは何かというところから、過去の他の論文を元に検討します。推定方法によっても、貧困率が結構異なっているということで、やはり統計というのは重要ですが、扱いが難しいですね。

ここでは、沖縄県の子どもの貧困率等の実態への近さから、戸室先生が採用した次の方法で、子どもの貧困率を計算しています。

戸室は、「就業構造基本調査」のオーダーメード集計データを用い、18歳未満の末子がいる世帯のうち、収入が生活保護の最低生活費以下の世帯の割合を子どもの貧困率として算出した。

説明変数

説明変数には、国勢調査や社会生活統計指標、就業構造基本調査などのデータを元に、

選定した人口・世帯、経済・労働、教育・福祉の3分野の説明変数47種

を選定されています。

これらを説明変数として、サポートベクターマシン(SVM)という手法を用いて、子どもの貧困率を説明するモデルを構築しています。

これは、なぜSVMなのか少し疑問ですね。
もちろん線形回帰モデルと比べると、SVMのほうが非線形のデータを扱うのに適していますが、今回のような構造化されたデータであれば、ランダムフォレストの方がいいのではないでしょうか。(分析も速いし)

説明変数同士で相関がありそう(”世帯人数が多い”と、”子どもの数が多い”って近いよね)なので、それらの多重共線性を抑えるためにも、ランダムフォレストの方が適切ではないかなぁ。と思ったりします。

もちろん、論文に書ききれていない中で、SVMと他の手法(ランダムフォレスト含む)を比較して、よりSVMの方が高い精度が出るよということかもしれませんので、あくまで一意見ということにさせていただきます。

結果と考察

モデルの精度は、決定係数(R2)は0.867と非常に高くなっています。
(こちら、都道府県別でNが47しかないので、自由度調整済み決定係数でないといけないと思うのですが、この決定係数が自由度調整済みかどうかは、論文からは不明)

そして、モデルの精度以上に重要なのが、どの変数が影響しているか。
それを、寄与度が高い順に+(子どもの貧困率を高める)、−(子どもの貧困率を低める)に整理したのが次のとおりです。

母子世帯 +
子ども数 +
失業率 +
製造業 −
共働き −
大企業 −
宿泊飲食業 +
学童保育所 −
保育所 −
短大大卒  −

母子家庭や子だくさんの家庭が多いことや、失業率が高い場合に、子どもの貧困率も高まるというのは、確かにその通りだと納得感がありますね。

逆に子どもの貧困率を低める指標としても、共働き家庭が多い・大企業が多い・学童保育所や保育所が多いというのは、やはり社会全体として子育てを助ける体制がある都道府県ほど、子どもの貧困率も下げることができているということなので、非常に重要な結果ではないでしょうか。

まとめ

本論文の課題として、次のようにまとめられていました。

今後の課題として、本稿で用いた手法は生態学的研究であるため、生態学的誤謬(EcologicalFallacy)の問題がある。すなわち、都道府県別の貧困率の解析から得られた要因は個人の貧困に関連付けられるものではなく、単に都道府県の貧困率差を説明するものにすぎない。地域の貧困対策により有用な情報を得るためには、市町村規模での時系列データや個人単位のミクロデータ等の各種データを利用した総合的な解析を行う必要がある。

確かに、本来は都道府県といった大きな単位ではなく、個人単位で、”なぜ貧困に陥ったのか”を分析することこそが、実際の対策には重要だと思います。

ただ、「あなたは貧困です。なぜ、そうなったかを教えて下さい」と聞いても答えてはくれないでしょう。(そもそも失礼ですし)
そうなると、市町村での分析というのが1ついいバランスなのかもしれませんし、都道府県でも十分価値が高い結果だと思いました。

一方で、課題でも書かれていますが、原因と結果の関係が分かりづらい様に思いました。

例えば、”保育所の数”。
これが多いから、子どもの貧困率が減っているのか。(”保育所の数”が原因で、”子どもの貧困率”が結果)
そもそも貧困が低いから、その都道府県は納税もちゃんとされてお金に余裕があり、その結果として保育所を多く作れているのか。(”子どもの貧困率”が原因で、”保育所の数”が結果)

これをしっかりと見極めていく必要はありそうです。
そこには、時系列の関係性(先に、保育所の数が増えて、後で子どもの貧困率が下がった)を分析していけると良さそうですね。

今回の論文で、「社会全体として子育てを助ける体制があると、子どもの貧困率が下がるのではないか」という仮説が生まれました。
今度、その様なテーマで、別の論文も読んでいきたいと思います。

いいなと思ったら応援しよう!