世界人口統計を分析して、改めて東京と日本の位置を確認した
日本では、人口減少や過疎化の問題があり、地方創生・行政サービスや生活関連サービスの効率化が求められたり、分散型社会モデルとかコンパクトシティ構想などが話題にあがったりします。
分析素人エンジニアが、UNの世界人口統計のデータをネタにSQLの勉強がてら可視化してみたら、いろいろ発見があったというお話しです。
動機
東京は世界一の都市という話しを聞いたりもするが、人口や規模の面で世界の他の国と比べてどうなのだろうか。時系列の推移も見たい。
日本の東京を中心とした都市部への人口集中の度合いは、どの程度なのだろうか。世界中の他の国や都市と比べてどうだろうか。
作業の流れ
UNの人口統計データは、CSVではなくExcel形式。データの変換処理を準備するのは面倒なので、Google SpreadSheetを準備してExcelのデータをコピー&ペースト。
準備したSpreadSheetをBigQueryの外部テーブルとして設定。
SpreadSheetに、MetabaseからBigQueryにアクセスするユーザを閲覧者として登録
Metabaseからの接続・データ閲覧テスト
BigQuery&Metabaseで可視化
成果物
国別の人口推移
思っていたよりも、中国とインドが圧倒的に抜きんでている。(右のグラフは、見やすさのため中国とインドを除外)
日本とロシアは同じ人口カーブ。ロシアの方が2000万人ほど多い。経済や文化の成長に類似?
ナイジェリアとパキスタンも上位へせまってきている
都市別の人口
都市の人口(区切り方にもよりそう)だけで見ると、東京は圧倒的。
2025年あたりで他の都市に追いつかれてきている。以後下降
カイロ(エジプト)、ブエノスアイレス(アルゼンチン)、キンシャサ(コンゴ)が驚きだった。
その国における巨大都市
東京は日本人の約3割の人が住んでいる。ブエノスアイレスはアルゼンチン人の33%(3人に1人)。
東京、ブエノスアイレスだけ30%前後で、その下は20%前後と離れている。2都市だけ特出している。
アルゼンチンは、パタゴニアなど広大な土地を持っているのに不思議。
中国とインドは、国の人口が多すぎて、人口割合の比較が有効でない。
都市群への人口集中
その国の、人口世界Top30位に含まれる都市に住んでいる人口の割合
東京と大阪に日本人の約44%が住んでいる。
中国とインドは、それぞれ6と5都市が含まれるが、人口の6, 7%程度。
フランスはパリの1都市であるが、かなり人口が集中している。
まとめ
実際に自分で手を動かしてみると、頭の中にあった世界との違いにいろいろ気付けた。情報を今の時代に合わせてアップデートできた。
可視化までつながると、SQLはより楽しい。
SpreadSheet + BigQuery + Metabase は、かなり便利で早い。(と思う)
次点
ヨーロッパなどの成熟した都市などとの比較
人口だけでなく、他の都市指標の比較(よいデータが見つかれば)
UNのデータに30万人以上の都市(300K Over cities)というのがあるので、それをベースにした集計・分析