Pythonでダミーデータ作成

2021年6月17日 23:53

データベースを学習するときに必要になるのがダミーデータではないでしょうか。データの件数が少ないとどうしてもSQLのパフォーマンスが良いのか悪いのかがわかりにくいときがあります。そこで今回は、PythonのFakerライブラリを使ってダミーデータを作成してみました。

Fakerのインストール

コマンドプロント（またはターミナル）で下記のコマンドを実行します。

pip install faker

コード

ダミーデータを生成するコードを下記に示します。
”名前、郵便番号、住所”のCSVファイルを作成するプログラムを作ってみました。
100000行のCSVファイルが作成されます。

from faker import Faker
import csv

fakedata = Faker('ja-JP')

for i in range(100000):
  name = fakedata.name()
  postcode = fakedata.postcode()
  add1 = fakedata.address()

  with open('dummy_address.csv','a',newline='') as f:
       writer = csv.writer(f)
       if i == 0:
          writer.writerow([name,postcode,add1])
       writer = csv.writer(f)
       writer.writerow([name,postcode,add1])

最後に

Fakerいろいろなダミーデータが作成できるようです。日本語のデータが作成できるところが便利です。英語だけのデータでもおいのですが、日本語のデータだとそれっぽさが多くて良いです。

おまけ、Windowsユーザの方へ

上記のコードだとエンコードのエラーが出る場合があります。その時は、ファイルをOpenする処理のところを下記のように書き換えます。

with open('test.csv','a',newline='',encoding='utf8') as f:

Pythonでダミーデータ作成

Fakerのインストール

コード

最後に

おまけ、Windowsユーザの方へ

いいなと思ったら応援しよう！