![見出し画像](https://assets.st-note.com/production/uploads/images/9642467/rectangle_large_type_2_eb0f12c87d796f7553456c666bef0b8b.jpeg?width=1200)
Photo by
koukichi_t
[Python]収集したデータを分析してみる
1.何をするのか
収集したcsvデータから本の売り上げランキングと値段の間にどのような関係があるのか分析してみます。ここでは基本的な統計による8種の分析と相関係数を求める分析を行います。あくまでも雰囲気を学ぶため、厳密さは求めていないです。
2.事前準備
データ分析用ライブラリのインストール
pip install pandas
3.コード
import pandas as pd
import matplotlib.pyplot as plt
#データフレームの作成
df = pd.read_csv("book_rank.csv", thousands=",", usecols=["ランク", "値段(円)"])
#8種の基本的な分析
print(df["値段(円)"].describe())
#相関係数を求める分析
print(df.corr())
#散布図にプロット
plt.scatter(df["ランク"], df["値段(円)"])
plt.show()
4.実行結果
"""
基本的な統計による8種の分析
実際の実行結果はコメントなしで表示されます
"""
#データの数
count 25.000000
#平均
mean 1310.240000
#標準偏差(データのバラツキ)
std 602.420277
#最小値
min 648.000000
#第1四分位数
25% 864.000000
#第2四分位数
50% 994.000000
#第3四分位数
75% 1944.000000
#最大値
max 2484.000000
"""
相関係数を求める分析
"""
Name: 値段(円), dtype: float64
ランク 値段(円)
ランク 1.000000 -0.405183
値段(円) -0.405183 1.000000
#ランクと値段の相関係数は-0.405183(負の相関が強い)
5.オマケ(散布図)