学習シリーズ第8弾!データ視覚化 (Matplotlib, Seaborn)
こんにちは!ChatGPTの原田です!学習シリーズ第8弾は「データ視覚化 (Matplotlib, Seaborn)」について学びます!では本文へどうぞ!!
1. 前回の答え
まずは前回の答えから!前回の記事はこちら!
1.1 Pandasによるデータ処理
DataFrameの作成:
import pandas as pd
# DataFrameの作成
df = pd.DataFrame({
'Name': ['Alice', 'Bob', 'Carol'],
'Age': [25, 30, 35],
'Gender': ['F', 'M', 'F']
})
新しい行の追加:
# 新しい行を追加
df = df.append({'Name': 'Dave', 'Age': 40, 'Gender': 'M'}, ignore_index=True)
特定の条件に合致する行の抽出:
# 年齢が30以上の行を抽出
df_filtered = df[df['Age'] >= 30]
1.2 NumPyによるデータ処理
10x10の行列の作成とランダムな数値の割り当て:
import numpy as np
# 10x10の行列を作成
matrix = np.random.rand(10, 10)
各行と各列の合計:
# 各行の合計
row_sums = np.sum(matrix, axis=1)
# 各列の合計
column_sums = np.sum(matrix, axis=0)
最大値と最小値の探索:
# 最大値
max_value = np.max(matrix)
# 最小値
min_value = np.min(matrix)
解説:
PandasのDataFrame:
`pd.DataFrame` を使用してDataFrameを作成し、辞書形式でデータを渡します。
`df.append` で新しい行を追加します。`ignore_index=True` は新しいインデックスを割り当てます。
条件に基づく行の抽出はブールインデックスを使用して行います。
NumPyの行列操作:
`np.random.rand` でランダムな数値を持つ行列を生成します。
`np.sum` で合計を計算し、`axis` パラメータで行方向か列方向を指定します。
`np.max` と `np.min` で行列内の最大値と最小値を見つけます。
これらのコードを実行することで、PandasとNumPyの基本的な使用方法を理解し、データの作成、操作、抽出の基本を学ぶことができます。
2. 学習スタート!
第8弾スタートです!
2.1 Matplotlib
import matplotlib.pyplot as plt
# データ準備
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# 折れ線グラフの作成
plt.plot(x, y)
plt.title("Line Graph Example")
plt.xlabel("X Axis")
plt.ylabel("Y Axis")
plt.show()
【実行結果】
2.2 Seaborn
import seaborn as sns
import matplotlib.pyplot as plt
# データセットの読み込み
tips = sns.load_dataset("tips")
# 箱ひげ図の作成
sns.boxplot(x="day", y="total_bill", data=tips)
plt.title("Box Plot of Total Bill by Day")
plt.show()
【実行結果】
MatplotlibとSeabornを組み合わせることで、柔軟性と美しさを兼ね備えた視覚化が可能になります。これらのライブラリを使いこなすことで、データの理解を深め、より有意義なインサイトを見つけ出すことができます!
3. 演習問題
3.1 Matplotlibを使ったデータ視覚化
Pandasで作成したデータフレームを用いて、いくつかの異なる種類のグラフ(例:折れ線グラフ、棒グラフ)を作成してみてください。
3.2 Seabornを使ったデータ視覚化
Seabornを使って、散布図や箱ひげ図などを作成してみてください。
これらのライブラリの基本的な使い方を学ぶことで、データの視覚化の技術を身につけることができます。
まとめ
第8弾のまとめです!
Matplotlib
概要: Pythonで最も一般的なデータ視覚化ライブラリ。多様なグラフとカスタマイズオプションを提供。
特徴:
折れ線グラフ、棒グラフ、散布図、ヒストグラムなど多くのグラフタイプ。
グラフの細部(色、ラベル、線種、軸など)のカスタマイズが可能。
対話型環境(Jupyterなど)との相性が良い。
使用法: データセットからグラフを作成し、視覚的にデータを分析・表現。
Seaborn
概要: Matplotlibに基づく高度な視覚化ライブラリ。統計的なデータ視覚化に特化。
特徴:
より洗練されたデフォルトのスタイル。
箱ひげ図、バイオリンプロット、熱地図など統計グラフのサポート。
複雑なデータセットの探索が容易。
使用法: 統計的なデータ解析を行い、洗練されたスタイルでグラフを表示。
これらのライブラリを学ぶことで、Pythonを使ったデータ視覚化の強力なスキルを習得できます! 今回は以上になります!
この記事が気に入ったらサポートをしてみませんか?