seabornでデータビジュアライゼーション(1)ヒストグラム
下準備
seabornでデフォルトデータセット,tips(食事の際にチップを払った客層タイプのデータ)を読み込む。ついでにその他に使用するライブラリもざっと準備。
import numpy as np
import scipy as sp
import pandas as pd
from pandas import Series,DataFrame
from scipy.stats import norm
#日本語対応化
import janome
#可視化
import matplotlib.pyplot as plt
import matplotlib as mpl
import seaborn as sns
sns.set()
import plotly.offline
import plotly.express as px
import plotly.graph_objs as go
import plotly.subplots
import squarify
%matplotlib inline
%precision 3
#サンプルデータ セット
tips = sis.load_dataset("tips")
ヒストグラム
diplot関数で描画。
引数kdeはカーネル密度推定を「描画する:True」か「しない:False」かの指定。デフォルトではTrueになっている。
カーネル密度描写無し
カーネル密度推定描写あり
区切り数を大まかor細かに変える。
オプション引数binsの数値を増減させることで細かな区切りに変えられる
ヒストグラムの描画方向を変える。
オプション引数verticalをTrueにすることでグラフを横向きに変えられる。
2つのヒストグラムを同時描写
ランチとディナーのどちらがチップが多いかを比較したい場合、着色したい方のオプション引数colorにredならr、blueならbといった風に指定することで同時描写可能。
質的変数の区別も描写
「喫煙者or非喫煙者」や「男or女」などの客質=質的変数のチップ払いを比較。
countplot(x=質的変数,データセット)で描写。
更に引数hueにカラム名を指定することでより細かく色分けして表示できる。