人文地理学のための数学・統計学(1): 多変量解析

出身学類の中で、「人文地理学には数学は不要」「数学ができない人が人文地理学に来る」などといった話を聞くことがある。その主張が根本的に誤っているとまでは思わないが、数学や統計学の知識があることで人文地理学に生かせる可能性がないとも私は考えていない。このことを踏まえて、学群1・2年生を主想定読者として、「微積分」「線形代数」「地球基礎数学」「地球統計学」などで扱われた内容をどう人文地理学的に応用できるか概観していきたい。
なお、筆者は数学がそれほど得意というわけではない(数学類開設科目が学群1年次のGPAを下げる原因でもあった)。内容の品質など不安な点は残るが、その点は了承願いたい。不備などがあれば随時修正していきたいと考えている。
第1部では多変量解析 (multivariate analysis)を主に取りあげる。多変量解析は、多変量のデータを分析するうえでの統計学の手法で、人文地理学でも回帰分析・因子分析など多変量解析を行った分析が行われている。統計学や多変量解析の理論系の話は教科書にせよnoteの記事にせよ他の方により多数公開されているため、今回は人文地理学における利用例を中心に紹介していきたい。

回帰分析

回帰分析 (regression analysis)は、ある事象どうしの相関関係や因果関係の有無の判定に用いることができる。説明変数が1つの場合は単回帰分析、複数の場合は重回帰分析という。被説明変数をy、説明変数をx1, …, xn、a0, …,anは定数(a0は切片、a1, …,anは偏回帰係数という)とするとき、以下の式を考える(左辺はyハットで、yの理論値を意味する)。

この式において、yハットとyの差(残差)の二乗和が最小になるように偏回帰係数の値が設定される。この方法を最小二乗法という。計算方法としては偏微分などを用いるが(詳細は張(2009)などを参照)が、実際は手計算ではなく統計ソフトや表計算ソフト、GISなどで計算することが普通だろうと思う。

回帰分析を用いた研究事例

回帰分析を用いた分析の例として、山神(2001)など、都市圏における人口密度の空間パターンの分析が挙げられる。一般に都心からの距離が増大するほど人口密度や地価が下落することを踏まえて、各地点における都心からの距離と人口密度の値をもとに(実際は対数変換する)回帰分析を行うことで、回帰式と残差の計算を行うことができる。このとき、残差の空間パターンなどに着目することもできるだろう。
この他、地価を事例に回帰分析を用いた考察を行うこともできる。例えば、山田(1991)では、住宅地地価や商業地地価を指標に大都市圏郊外の地価の分布と変化を論じている。住宅地地価では都心からの距離の1変数の影響が大きいため単回帰分析を行っているが、商業地地価では常住人口など別の複数の変数の影響を受けるため重回帰分析を行っている。

因子分析

因子分析 (factor analysis)は、大ざっぱにいうと、多数の変数から少数の重要な変数を抽出するための分析方法といえる。(なお、厳密には「主成分分析」とは異なるが、人文地理学では「主成分分析」=「因子分析」で差し支えない。)
因子分析の際に地理行列を用いる場合もある。属性行列(行に地域、列に属性を表示する)を因子分析すると等質地域、相互作用行列(2地域間における属性値を行列の成分として表示したもの)を因子分析すると機能地域の設定を行うことになる。

因子分析を用いた研究事例

因子分析を用いた近年の研究事例として、例えば、就業機会に着目してインドの空間構造を考察した鍬塚(2018)は、632地区における34変数のデータを用いた632行34列の属性行列を作成したうえで、主成分分析とクラスター分析を行っている。
交通流動をもとに地域構造を分析する研究も行われてきた。古い研究ではあるが、奥井(1980)は、北海道のトラック交通を示すOD行列(発地(origin)と着地(destination)の関係性を行列の成分で示した相互作用行列)に対して因子分析を行い、交通圏(機能地域)の設定や、発地と着地の地域的特性の解明などを行っている。
地域イメージの研究でも因子分析を用いることができる。地域イメージの構成要素などを考察した野村・吉田(2009)では、SD法の一作業として因子分析を行い、場所イメージにあたる形容詞(「わくわくする」「楽しい」など)で影響力が大きいものの抽出などを行っている。
また、1970年代-1980年代を中心に、居住地域構造研究において因子生態 (factor analysis)という、因子分析を用いた分析が盛んだった時期もあった。ただし、近年ではGISを用いた分析など研究動向の変化がみられる(詳細は中澤(2016)など参照)。

その他の多変量解析

このほか、人文地理学における多変量解析については村山・駒木(2013)で紹介されているので、興味のある方はぜひ参照して欲しい。正準相関分析、多次元尺度構成法、数量化理論などがある。

数学的な原理

今回は基本的に省略したが、多変量解析の数学的な原理は、例えば小西(2010)で解説されている。ここではラグランジュの未定乗数法や固有ベクトルなどもでてくるが、微積分や線形代数の授業を秋Cモジュールまで受けていれば内容はある程度理解できるかもしれない。

関連リンク

引用文献