見出し画像

【ChatGPT】Code interpreterで何ができるのか?をご紹介します

OpenAIが、7月7日の七夕の日に、革命的なプラグインCode interpreterを公表しました。
Twitterでもトレンドになるほど盛り上がっています。

この記事では、実際、Code interpreterでどんなことができるのか?

タイタニック号の乗船客データを使って、みなさんと一緒に、見ていきたいと思います。

最終的には、機械学習モデルを作成してますので、ぜひ、最後までお読みください。


🥎 Code interpreterとは

簡単にいうと、ChatGPTにデータを読み込ませ、データ解析、グラフ作成、ファイル編集、計算などをさせることができるプラグインです。

高度なデータ分析や可視化を、Pythonコードを書くことなく、人間の言葉で実行することができるようになりました。
これは革命です。

今のところ、ChatGPT Plusユーザーで利用可能になっています。


⚽️ Code interpreterを使えるようにする

ChatGPTにアクセスします。
左端下の三本線をクリックし、メニューからSettingsを選択します

Beta featuresのCode interpreterをオンにします

チャット画面でGPT-4を選択しCode interpreterにチェックマーク入れます

チャット欄にプラスマークがついていれば成功です
プラスマークを押すとファイルを読み込むことができます


🏈 Code interpreterで何ができるかのか?


実際、Code interpreterで何ができるのでしょう?
タイタニック号の乗船客データを用いて、Code interpreterの動きを見ていきたいと思います。

データは、こちらのKaggleにあるデータ(train.csv)を使いました。


✅ CSVデータの中身を確認する

データの中身を見てみます。
CSVファイルを読み込んで最初の3行を表示させます。

ちゃんと表示されましたね


✅ データの概要を表示する

各データ項目(カラム)が何を意味しているのか、聞いてみましょう。

かなり詳細な回答が返ってきましたね


✅ データからインサイトを得る👀

ざっくり、このデータ項目から何が読み取れるのか聞いてみましょう。

データ項目と生存率との関係について細かく分析してくれてますね


✅ データの可視化①

各データ項目と生存率との関係を可視化してみましょう。

これはすごいですね


✅ データの可視化②

データ分析でよく使う相関ヒートマップをやってみましょう

ヒートマップの作成だけでなく、数値の考察まで行ってくれました


✅ 新たな特徴量を考えてもらう

新たなデータ項目の生成(特徴量エンジニアリング)をやってもらいます。

✅ 機械学習モデルを作ってもらう

ChatGPTに機械学習モデルを作ってもらいます。
評価指標を指定しておきましょう。

ランダムフォレストでモデルを作成してくれました。
AUC0.808とはまあまあですかね

❇️ Show workを押すと、具体的なコードを見ることができます。


✅ モデルを変えてみる

ロジスティック回帰で作ってもらいましょう

ランダムフォレストより精度が上がりましたね


🏀 さいごに


いかがでしたでしょうか。

このプラグインの出現は、データ分析の革命ですね。
ChatGPTが日々、進化しているように、このプラグインも、どんどん進化することが予想されます。
現時点で、これだけのことができるので、1年後にはもっと凄いことになっているでしょう。

果たして、人間に求められる能力とは何なのか?
よくよく考えていく必要がありそうです。

よろしければサポートお願いします! いただいたサポートはクリエイターとしての活動費に使わせていただきます!