Matplotlib基礎
こんにちは、コグラフ株式会社データアナリティクス事業部の平松です。
今回はPythonメジャーライブラリの一つである「Matplotlib」の基礎について、コードを用いて解説します。
コードではNumPyも用いて解説しているので、合わせてimportし、学んでみて下さい!
これからMatplotlibを学び始めようという方、初心者の方は必見です!
Matplotlibとは
matplotlibとはPythonにおけるグラフ描画の標準的なライブラリです。
Matplotlibを使うことで、データの可視化が簡単に行えます。
折れ線グラフ、ヒストグラムや散布図などが表現可能です。
機械学習のほぼすべての工程において、Matplotlibを使ったデータの可視化が必要になってくるので、機械学習において最初に学んでおくべき基本的なスキルとなります。
折れ線グラフ
折れ線グラフは、plt.plot()で出力できます。
引数は(横軸, 縦軸)という順番です。
np.arange(10)は0を含めて10個分の離散的な値を表示するという意味です。
なので、この例では0~9までが表示されます。
np.random.randint(-10,0,10)は-10から0の間でランダムに10個の数字を表示という意味になります。
import matplotlib.pyplot as plt
import numpy as np
x = np.arange(10)
y = np.random.randint(-10,0,10)
plt.plot(x, y)
plt.show()
散布図
散布図はplt.scatter()で出力できます。
markerはマーカーの形 (デフォルト値: ‘o’= 円形)を変更できる引数です。
「s」はマーカーのサイズ (デフォルト値: 20)を変更できる引数です。
数値を上げると、マーカーサイズも大きくなります。
他にも引数は多くあります。
x = np.random.randint(0,20,20)
y = np.random.randint(50,100,20)
plt.scatter(x, y, marker='*', s=50)
plt.show()
ヒストグラム
ヒストグラムはplt.hist()で出力できます。
binsは階級数(デフォルト値: 10)、いわゆる表示する棒の数を変更できる引数です。
x = np.random.randint(0, 20, 500)
plt.hist(x, bins=10)
plt.show()
棒グラフ
棒グラフはplt.bar()で出力できます。
plt.figureでは引数にfigsizeをとり、描写全体のサイズや背景色を変更したりすることが可能です。
引数については下に表を載せておきます。
x = ['Luis', 'Rynn', 'Hiramatsu', 'Morozumi']
y = np.random.randint(0,200,4)
plt.figure(figsize=(9, 6))
plt.bar(x, y)
plt.show()
タイトル、軸の名前変更
plt.titleでタイトル名の変更
plt.xlabelで横軸のラベル名の変更
plt.ylabelで縦軸のラベル名の変更ができます。
x = np.arange(10)
y = np.random.randint(0,20,10)
plt.plot(x, y)
plt.title('result')
plt.xlabel('time')
plt.ylabel('value')
plt.show()
ヒートマップ
ヒートマップはplt.imshowで出力が可能です。
vmin、vmaxは色調の範囲を指定する引数です。
vmin=0、vmax=1とすると数値0~1の間で配色が行われます。
なので、数値の範囲とカラーマップの基準点を一致させることをオススメします。
cmapはベースとなる配色を設定する引数になります。
plt.colorbarは出力結果の右にある配色バーの表示をします。
np.random.rand()は、連続一様分布の乱数を生成しそれを配列にするものです。
この例では引数が(10,10)なので、10×10の配列の乱数を連続一様分布の中から発生させます。
data = np.random.rand(10, 10)
plt.imshow(data, vmin=0, vmax=1, cmap='hot')
plt.colorbar()
plt.show()
データ分析に興味のある方募集中!
コグラフ株式会社データアナリティクス事業部ではPythonやSQLの研修を行った後、実務に着手します。
研修内容の充実はもちろん、経験者に相談できる環境が備わっています。
このようにコグラフの研修には、実務を想定し着実にスキルアップを目指す環境があります。
興味がある方は、下記リンクよりお問い合わせください。
Twitterもやってます!
コグラフデータ事業部ではTwitterでも情報を発信しています。
データ分析に興味がある、データアナリストになりたい人など、ぜひフォローお願いします!