見出し画像

ChatGPT でデータ分析用のサンプルデータを作成する

勉強会やセミナーでのサンプルデータの準備が大変だ

データ分析の勉強会やセミナーを行う時に大変なのがサンプルデータの準備だ。データがあればそれをみながら分析観点をピックアップしたり、処理の解説を作ったりできる。が、サンプルデータから作るとなると結構大変だ。

月末に社内で ChatGPT 勉強会をやるのだが、そこで ChatGPT Code Interpreter のデモストーリーに Web アクセス解析を取り上げることにした。さぁ、サンプルデータの作成だ。

「どんな項目が必要かね」「やはり時間はタイムスタンプ形式がリアルだろうか」「Analytics からサンプルをダウンロードしてみようか、あらら、これじゃ遠いし大変だな」なんて思案しているときに思った。

そうだ、ChatGPT に作ってもらおう


ChatGPT でWebアクセスログのサンプルデータを作る

データ分析の観点を盛り込んだテキトーなサンプルが欲しい。そこで、こんな感じで頼んでみた。

すると ChatGPT がこう聞いてきた。

ユー、できるねー!

項目を理解して適切なデータ範囲を設定してくれている。

Microsoft は ChatGPT を盛り込んだ機能を Copilot(副操縦士)としてブランディングしているけど、このコーパイ、なかなかデキる。「サンプルデータ作って」って頼んで数秒でこういう返しをしてくれる後輩がいたら仕事は楽だ。

あとで「時間帯別分析」を入れたいから「時間ごとに作って」とお願いする。もう数秒で完成する。Excel ファイルとしてダウンロードできた。

コンバージョンって何のコンバージョンなんじゃい


生成したデータをアウトルックする

このサンプルデータがどのくらいランダムなものなのかをザックリ掴みたい。作った本人に聞いてみよう。

命令口調ではなく丁寧語でお願いすることがポイントだと思っている

うんうん、ざっくり丸投げしたけど、そうそう平均や中央値・最大値・最小値が聞きたかったんだよ。

どれどれ。どんなデータなんだ?確かに閾値があらかじめ設定されているからとんでもないデータではなさそうだ。なんて思っていると、ChatGPT が一方的に話を続ける。

分析終わってるじゃん 😅

ChatGPT Code Interpreter を使えば、データ分析とグラフ化が簡単にデキちゃう。時間帯別ヒートマップや相関分析も全然問題ない。


ファイル分割や計算処理など自由自在

今回はサンプルデータの作成が目的。データ準備で便利なタスクとしては月単位でのファイルの分割や月別や週別の合計・累計を計算してくれるのも助かる。

一応、分割された範囲計算や合計計算した値を検算しましたが、特に問題ありませんでした。Code Interpreter は内部的にプログラム計算処理と連携しているので、計算結果は問題ないみたい。これまでの ChatGPT は小学生に計算させている感覚があったけど、もうデキる大学生くらいになった。

ChatGPT はナカナカ使えるやつです 😎

いいなと思ったら応援しよう!