追記:Jointplotと考察追加しました。20240104 22:10
Code interpreter って?
ChatGPT4のプラグインにCode interpreterがあります。
このプラグインはChatGPT4のデフォルトに組み込まれていますので、特別な設定もいりませんし、Pythonが使えなくても、データを与えて「分析して」等と指示するだけでChatGPT上でデータ可視化ができたりします‼️
非Pythonユーザーでも大丈夫🙆。Pythonは可視化のバラエティが豊富なのでいいですよぉ。
まずCode Interpreterって何?をChatGPTに聞いてみました。
ちょっとマニアックだったり、計算コストがかかる処理は。。。って感じですが、
って時は、ノーコードでできるChatGPTの方が圧倒的にいい🎯。
ということで、データ可視化をやってみました。
ボストン住宅価格データセットを可視化
「ボストン住宅価格データセット」は、機械学習で有名なデータセットです。
以下は、ChatGPTによるこのデータセットの解説。
ボストン住宅価格データセットのダウンロード
データセットは、以下のサイトからダウンロードしました。
データ概要確認
まず、ChatGPTにデータセットをインプットして、データ概要を確認しました。指示は以下、生成結果は動画をみてください。
基本統計量は、全データの値を示してくれなかったので、以下の指示を追加しました。
うん。いい感じです。
次は、可視化です。
データ可視化
追記:当初、Jointplotは何度指示してもうまく実行できませんでしたが、再度データを読み込んでから指示するといけました。
このように、ダメな時はデータを再度読み込むといける時もあるかも⁉️
これも「目的変数でヒートマップ表示して」と指示すると以下になります。
データ考察
最後に
おぉ〜、探索的データ分析(EDA)は、十分こなせそう‼️
Pythonには、AutoEDAツールと呼ばれるライブラリがいくつかありますが、これらでできるのは可視化だけ。
ChatGPTはデータ傾向の考察もしてくれるので、これはヤバい💦。
しかもノーコード。。。
慣れないコードを駆使してPythonと格闘していたのはなんだったのか。
これからはコード学習ではなく、Pythonのライブラリでどのような可視化ができるのかを知ることのほうが大事かも(←知ってると指示できるから)
以下はPythonライブラリ、seabornのギャラリーです。
この記事であつかったデータは欠損値がない完全データ。
案外 手間がかかるのは前処理なので、次は前処理が必要なデータでやってみようかな。
最後まで見ていただきありがとうございました😊。