見出し画像

Pythonでダミーデータ作成

データベースを学習するときに必要になるのがダミーデータではないでしょうか。データの件数が少ないとどうしてもSQLのパフォーマンスが良いのか悪いのかがわかりにくいときがあります。そこで今回は、PythonのFakerライブラリを使ってダミーデータを作成してみました。

Fakerのインストール

コマンドプロント(またはターミナル)で下記のコマンドを実行します。

pip install faker

コード

ダミーデータを生成するコードを下記に示します。
”名前、郵便番号、住所”のCSVファイルを作成するプログラムを作ってみました。
100000行のCSVファイルが作成されます。

from faker import Faker
import csv

fakedata = Faker('ja-JP')

for i in range(100000):
  name = fakedata.name()
  postcode = fakedata.postcode()
  add1 = fakedata.address()

  with open('dummy_address.csv','a',newline='') as f:
       writer = csv.writer(f)
       if i == 0:
          writer.writerow([name,postcode,add1])
       writer = csv.writer(f)
       writer.writerow([name,postcode,add1])

最後に

Fakerいろいろなダミーデータが作成できるようです。日本語のデータが作成できるところが便利です。英語だけのデータでもおいのですが、日本語のデータだとそれっぽさが多くて良いです。

おまけ、Windowsユーザの方へ

上記のコードだとエンコードのエラーが出る場合があります。その時は、ファイルをOpenする処理のところを下記のように書き換えます。

with open('test.csv','a',newline='',encoding='utf8') as f:


いいなと思ったら応援しよう!