見出し画像

【ChatGPT4使ってみた⑦】デモをしたい人向け!ダミーデータの作り方(データ分析者向け)


▼この記事でわかること

 これまで、データ分析者や製品デモをしたい人が困っていることの1つに、『ダミーデータの作成』ですよね!
   ダミーデータ作成時には、たくさんのを行を自分で生成し、それを基に自分の紹介したいデータ分析手法や商品のデモをしていたかと思います。でも、ランダムでデータを作るのは一苦労なのですよね・・・。PythonやExcelを駆使されていた方が多いのではないでしょうか。
 この記事では、そんな『ダミーデータ作成業務』をローコードで実装するChaTGPTの使い方を紹介します。これで皆さんが本来のデモや製品紹介に集中できればと思います。

▼初回の失敗プロンプト

①初回のプロンプト

 まず必要なダミーデータの条件を記載したプロンプトを作成します。私が必要だったのは、1000件の和菓子屋さんの売上データです。以下のようにプロンプトを作成してみました。

初回のプロンプト

 そして!プロンプトの結果はこちら。CSVを渡してくれました!

ChaTGPTの回答

 お!しっかりできているじゃないか!ということで、中身を見てみたところ・・・全然ダメでした!!何がダメだったか、次の項目で説明していきますね。ぱっと見それっぽいデータができてしまうところが、ChaTGPTさんの怖いところですね…。

ChaTGPTのcsvアウトプット(実はダメダメ…)

②アウトプットが全然ダメだった…

 今回店舗別の売上データを用意してもらったのですが、絶対に修正しなければいけないポイントがありました。それは・・・

 よく見ると、同じ住所が多い!。関西のデータが多いようにという指示をしたのはこちらなのですが、なんと調べてみると以下のように『6種類の住所しかありませんでした!』

生成されたダミーデータの住所内訳

 これだとダミーとはいえ人工的すぎて実用に適さないので、プロンプトを変更し改善してみました!

▼改善したプロンプト例

 上記を踏まえ、住所がばらつくように修正してみました。以下ハイライトのとおり、『全都道府県が存在するようにしてください』と、住所についちぇより詳しく指示を追加しました。

改善したプロンプト

 すると、アウトプットの住所がしっかりばらつくようになりました!かつ、等分ではなくしっかりランダムになっていますね!

新しいダミーデータの住所内訳

▼ダミーデータの指示は丁寧に!

 ということで、ダミーデータを作るときの注意点は以下と結論づけることができます。

 ①データのばらつきを指示すること
 ②最低限入れてほしいデータを記載すること(例:全都道府県)
  (①だけだとデータが偏りがち)

 最後にコピペ用プロンプトを貼っておきますので、ぜひ皆さんもダミーデータ生成業務を効率化してください!

以上です。
この記事がもし少しでもためになっていれば、励みになりますので「いいね!」やフォローをお願いします!
Twitter(現、X)のフォローもお待ちしています!
https://twitter.com/mtani00

▼【コピペどうぞ】ChatGPTプロンプト

*以下をコピペ下さい!

----------------------------------------
店舗別売上データが記載されたダミーデータをcsvで1000件作成ください。
列にしたい項目は以下です。
・店舗名
・店舗の住所(都道府県から正確に記載ください。全都道府県が存在するようにしてください)
・月間売上データ(1000~1000000円の間で記載ください)
・関西エリアで売り上げが多いような傾向にしてください。
・売上が大きい店舗や小さい店舗、などしっかりばらつきがあるようにデータを生成ください。
----------------------------------------

この記事が気に入ったらサポートをしてみませんか?