記事一覧
比例尺度を順序尺度に変換、色々な統計量をみる
年齢のデータを20代、30代という風に分けたいとき 価格のデータを安い、普通、高いという風に分けたい時に使える #ageのヒストグラムを表示sns .distplot(titanic["Age"])…
散布図、箱ひげ図、ヒストグラムを用いて外れ値を見る
外れ値は平均などの統計量に影響を与えてしまう。 外れ値を見るために散布図を見る #必要なライブラリのインポートimport pandas as pdimport seaborn as snsimport matp…
Kaggleの流れ2(欠損値の多いデータの扱い)
データ(列)の欠損値が多いとseabornでヒストグラムを扱えない。 また、上位者は約20%の欠損値のある列は列ごと消している。 #データの読み込みtitanic =pd.read_csv("tita…