清純GPT野郎は、BIデータの憂う目は見ない。

前回

今回
改めて、図をたくさん用意した。

### 目的:
2019年から2021年の訪問者データを分析し、年ごとのクラスターごとの**合計訪問者数**と**中央値**を比較・分析するためのデータを紹介します。このデータは、各都道府県における月ごとの訪問者数をクラスター別に分類しており、移動の傾向を把握するための重要な情報を含んでいます。

### データの概要:
データは**市町村単位で計測され、都道府県レベルで集計された**訪問者数を示しています。2種類のデータ形式が提供されています。
1. **中央値(K単位)**: 典型的な訪問者数を示し、極端な値に左右されないため、一般的な移動の傾向を把握するのに有効です。数値は「K」で表現されています(例:80K)。
2. **合計値(M単位)**: 各都道府県における訪問者数の総数を示します。全体的な移動量の変動を把握するために役立ちます。数値は「M」で表現されています(例:80M)。

訪問者数は以下の4つのクラスターに分かれています。
- **クラスター1(休日深夜)**: 休日の深夜1時~4時の訪問者数
- **クラスター2(休日昼間)**: 休日の昼11時~14時の訪問者数
- **クラスター3(平日昼間)**: 平日の昼11時~14時の訪問者数
- **クラスター4(平日深夜)**: 平日の深夜1時~4時の訪問者数

各年ごとのクラスターと訪問者数のデータは、都道府県別に市町村単位で計測されています。

2019年の訪問者数(合計値)
2020年の訪問者数(合計値)
2021年の訪問者数(合計値)


2019年の訪問者数(中央値)
2020年の訪問者数(中央値)
2021年の訪問者数(中央値)

さて、こんなにがんばった理由はほかでもない。
ちょっとだけ本気の1歩手前になったのは、ChatGPTが言うことを聞かなかったからである。
ChatGPTが分かりやすいように配慮したからである。
おそらく、人間の目にも少し整理されたと思う。
同じパターンが続くところ、異なるパターンが現れるところ、目につくものはいくらでもあり、コロナが背景にあるので~、コロナがあるにも関わらず~と、どやどや言いたくなる。

そこで、ChatGPTの力を借りて、ロバストな考察をしたかったのだが、このときのわたしはまさかあんなことになるとはゆめゆめ思わなかった。

To be continued.

データ元
https://www.geospatial.jp/ckan/dataset/mlit-1km-fromto


いいなと思ったら応援しよう!

Yuki
Thank you for your support. We are the world.