Tableauのクラスター機能を使って「女性は30歳までに結婚」を検証してみた
こんにちは。Tableau DATA Saberを目指して勉強中のkanaです。
今回は国勢調査のデータから、よく耳にする「女性は30歳までに結婚」は令和でも一般的なのかを、Tableauのクラスタリング機能を使って検証してみました。
結論
tableauのクラスタリング機能を使って2000年と2020年の未婚率データを、結婚する人の多いクラスターと結婚する人の少ないクラスターに分類してみました。
2000年時の分類の堺値は女性が31歳、男性が34歳となっていましたが、2020年時の分類の堺値は女性が35歳、男性が39歳となっており、「令和の女性は35歳までに結婚」する人が多いことが分かりました。
検証内容
今回使用したデータ
総務省が行っている日本に住んでいるすべての人と世帯を対象とする統計調査である、国勢調査(2000年、2020年)のデータをお借りしました。
クラスタリング機能
tableauにはアナリティクスペインの中に「クラスター」モデルがあります。
今回はこのクラスタリング機能を使って、未婚率×年齢の分布を2つに分類してみます。
やり方はとても簡単で、まずは未婚率×年齢の分布チャートを作成します。
その後、アナリティクスペインから「クラスター」をビューまでドラッグし、ビュー内のターゲット エリアにドロップするだけです。
クラスターの変数は「未婚率」と「年齢」、クラスターの数は「2」に設定します。
すると、tableauにより自動的に最適な2つのクラスターに分類されます。
今回は未婚率の減少が激しいクラスター(≒結婚する人の多い年齢)と未婚率の変化が落ち着いているクラスター(≒結婚する人の少ない年齢)に分類することが出来ました。
2000年時の分類の堺値は女性が31歳、男性が34歳となっており、確かに女性は30歳までに結婚する人が多かったようです。
一方、2020年時の分類の堺値は女性が35歳、男性が39歳となっており、男女ともに+5歳晩婚化しています。
従って、最新の国勢調査の結果から「令和の女性は35歳までに結婚」する人が多いことが分かりました。
クラスタリングの仕組み
Tableau はクラスタリングに k 平均法を使用しています。詳しい仕組みに興味のある方はtableauヘルプを参照ください。
おまけ
Tableau Publicに投稿したVizには都道府県別や年齢別での未婚率ランキングを作成しています。
是非、あなたのお住まいの都道府県は結婚が早いのか遅いのか確認して遊んでみてください。
(リンク先の名称が認証されずタイトル未設定になってしまいましたが、tableau publicのリンクです)
最後に
tableauはAI分析に力を入れており、他にも予測モデルを構築したり、データを説明したりも出来ます。
機械学習やアルゴリズムなど詳しい事が分からなくても、AIを使って簡単にデータからインサイトを得ることが出来るのはありがたいですね。
エンジニアではない人こそtableauを使ってみることをお勧めします!