#11 DB/Pandas MySQL データベースをPythonで扱えるようにする
前回作ったデータは、DB(サーバー上に存在している)だけなので、データ解析をするにあたって、Pythonで扱える領域に引き込む。
データ解析で使用するpandasとSQLを引き込むためのパッケージをimportします。
import pandas as pd
import sqlalchemy as sa
もし、パッケージをインストールしてなければpipでインストールします。
pip install pandas
pip install sqlalchemy
これでインストールできます。
importの次は、SQLに接続していきます。
url = 'mysql+pymysql://root:root@localhost:3306/vrest?charset=utf8mb4'
1つ目のroot・・・ユーザー名
2つ目のroot・・・パスワード
localhost・・・IP
3306・・・ポート番号
vrest・・・データベース名
utf9mb4・・・照合順序
をそれぞれ自分の環境に合わせて入力します。MAMPのPreferencesからポート番号を確認できます。
engine = sa.create_engine(url, echo=False)
これで接続するためのエンジンの作成ができます。
query1 = "select * from vrest.users"
query2 = "select * from vrest.score"
select * によって、vresデータベースの、user,svoreテーブルすべてのデータを引っ張ってきます。(ここで解析はしなしので)
df1 = pd.read_sql(query1,con = engine)
df2 = pd.read_sql(query2,con = engine)
pdのデータフレームに埋め込みます。
csvに変換する場合は、
df1.to_csv('df1.csv')
df2.to_csv('df2.csv')
でcsvに変更できます。
これで、扱えるデータとして引き込みが完了しました。