人文地理学のための数学・統計学(1): 多変量解析
出身学類の中で、「人文地理学には数学は不要」「数学ができない人が人文地理学に来る」などといった話を聞くことがある。その主張が根本的に誤っているとまでは思わないが、数学や統計学の知識があることで人文地理学に生かせる可能性がないとも私は考えていない。このことを踏まえて、学群1・2年生を主想定読者として、「微積分」「線形代数」「地球基礎数学」「地球統計学」などで扱われた内容をどう人文地理学的に応用できるか概観していきたい。
なお、筆者は数学がそれほど得意というわけではない(数学類開設科目が学群1年次のGPAを下げる原因でもあった)。内容の品質など不安な点は残るが、その点は了承願いたい。不備などがあれば随時修正していきたいと考えている。
第1部では多変量解析 (multivariate analysis)を主に取りあげる。多変量解析は、多変量のデータを分析するうえでの統計学の手法で、人文地理学でも回帰分析・因子分析など多変量解析を行った分析が行われている。統計学や多変量解析の理論系の話は教科書にせよnoteの記事にせよ他の方により多数公開されているため、今回は人文地理学における利用例を中心に紹介していきたい。
回帰分析
回帰分析 (regression analysis)は、ある事象どうしの相関関係や因果関係の有無の判定に用いることができる。説明変数が1つの場合は単回帰分析、複数の場合は重回帰分析という。被説明変数をy、説明変数をx1, …, xn、a0, …,anは定数(a0は切片、a1, …,anは偏回帰係数という)とするとき、以下の式を考える(左辺はyハットで、yの理論値を意味する)。
この式において、yハットとyの差(残差)の二乗和が最小になるように偏回帰係数の値が設定される。この方法を最小二乗法という。計算方法としては偏微分などを用いるが(詳細は張(2009)などを参照)が、実際は手計算ではなく統計ソフトや表計算ソフト、GISなどで計算することが普通だろうと思う。
回帰分析を用いた研究事例
回帰分析を用いた分析の例として、山神(2001)など、都市圏における人口密度の空間パターンの分析が挙げられる。一般に都心からの距離が増大するほど人口密度や地価が下落することを踏まえて、各地点における都心からの距離と人口密度の値をもとに(実際は対数変換する)回帰分析を行うことで、回帰式と残差の計算を行うことができる。このとき、残差の空間パターンなどに着目することもできるだろう。
この他、地価を事例に回帰分析を用いた考察を行うこともできる。例えば、山田(1991)では、住宅地地価や商業地地価を指標に大都市圏郊外の地価の分布と変化を論じている。住宅地地価では都心からの距離の1変数の影響が大きいため単回帰分析を行っているが、商業地地価では常住人口など別の複数の変数の影響を受けるため重回帰分析を行っている。
因子分析
因子分析 (factor analysis)は、大ざっぱにいうと、多数の変数から少数の重要な変数を抽出するための分析方法といえる。(なお、厳密には「主成分分析」とは異なるが、人文地理学では「主成分分析」=「因子分析」で差し支えない。)
因子分析の際に地理行列を用いる場合もある。属性行列(行に地域、列に属性を表示する)を因子分析すると等質地域、相互作用行列(2地域間における属性値を行列の成分として表示したもの)を因子分析すると機能地域の設定を行うことになる。
因子分析を用いた研究事例
因子分析を用いた近年の研究事例として、例えば、就業機会に着目してインドの空間構造を考察した鍬塚(2018)は、632地区における34変数のデータを用いた632行34列の属性行列を作成したうえで、主成分分析とクラスター分析を行っている。
交通流動をもとに地域構造を分析する研究も行われてきた。古い研究ではあるが、奥井(1980)は、北海道のトラック交通を示すOD行列(発地(origin)と着地(destination)の関係性を行列の成分で示した相互作用行列)に対して因子分析を行い、交通圏(機能地域)の設定や、発地と着地の地域的特性の解明などを行っている。
地域イメージの研究でも因子分析を用いることができる。地域イメージの構成要素などを考察した野村・吉田(2009)では、SD法の一作業として因子分析を行い、場所イメージにあたる形容詞(「わくわくする」「楽しい」など)で影響力が大きいものの抽出などを行っている。
また、1970年代-1980年代を中心に、居住地域構造研究において因子生態 (factor analysis)という、因子分析を用いた分析が盛んだった時期もあった。ただし、近年ではGISを用いた分析など研究動向の変化がみられる(詳細は中澤(2016)など参照)。
その他の多変量解析
このほか、人文地理学における多変量解析については村山・駒木(2013)で紹介されているので、興味のある方はぜひ参照して欲しい。正準相関分析、多次元尺度構成法、数量化理論などがある。
数学的な原理
今回は基本的に省略したが、多変量解析の数学的な原理は、例えば小西(2010)で解説されている。ここではラグランジュの未定乗数法や固有ベクトルなどもでてくるが、微積分や線形代数の授業を秋Cモジュールまで受けていれば内容はある程度理解できるかもしれない。
関連リンク
多変量解析 地域分析への応用 (筑波大学空間情報科学分野Webサイト)
引用文献
奥井正俊 1980. トラック交通流動からみた北海道の地域構造. 地理学評論 53: 263-279
鍬塚賢太郎 2018. インドの空間構造に関するデータ分析―2011年国勢調査を用いた就業機会の地区類型―. 地理科学 73: 93-113.
小西貞則 2010. 『多変量解析入門―線形から非線形へ―』岩波書店.
張 長平 2009. 『増補版 地理情報システムを用いた空間データ分析』古今書院.
中澤高志 2016. 職業別純移動にみる東京圏の居住地域構造. 経済地理学年報 62: 39-56.
野村幸加・吉田圭一郎 2009. 東京ディズニーランドのイメージ構成要素とその形成要因. 季刊地理学 61: 225-233.
村山祐司・駒木伸比古 2013. 『新版 地域分析』古今書院.
山神達也 2001. わが国の3大都市圏における人口密度分布の変化. 人文地理 53: 509-531.
山田浩久 1991. 東京大都市圏周辺地域における地価分布とその変動. 経済地理学年報 37: 354-368.
由井義通 1984. 広島市における住宅団地の形成とその居住地域構造. 人文地理 36: 152-170.