![見出し画像](https://assets.st-note.com/production/uploads/images/54838353/rectangle_large_type_2_1ba47089bc26b0f2b81159c187b407d4.png?width=1200)
Pythonでダミーデータ作成
データベースを学習するときに必要になるのがダミーデータではないでしょうか。データの件数が少ないとどうしてもSQLのパフォーマンスが良いのか悪いのかがわかりにくいときがあります。そこで今回は、PythonのFakerライブラリを使ってダミーデータを作成してみました。
Fakerのインストール
コマンドプロント(またはターミナル)で下記のコマンドを実行します。
pip install faker
コード
ダミーデータを生成するコードを下記に示します。
”名前、郵便番号、住所”のCSVファイルを作成するプログラムを作ってみました。
100000行のCSVファイルが作成されます。
from faker import Faker
import csv
fakedata = Faker('ja-JP')
for i in range(100000):
name = fakedata.name()
postcode = fakedata.postcode()
add1 = fakedata.address()
with open('dummy_address.csv','a',newline='') as f:
writer = csv.writer(f)
if i == 0:
writer.writerow([name,postcode,add1])
writer = csv.writer(f)
writer.writerow([name,postcode,add1])
最後に
Fakerいろいろなダミーデータが作成できるようです。日本語のデータが作成できるところが便利です。英語だけのデータでもおいのですが、日本語のデータだとそれっぽさが多くて良いです。
おまけ、Windowsユーザの方へ
上記のコードだとエンコードのエラーが出る場合があります。その時は、ファイルをOpenする処理のところを下記のように書き換えます。
with open('test.csv','a',newline='',encoding='utf8') as f: