![見出し画像](https://assets.st-note.com/production/uploads/images/110428082/rectangle_large_type_2_aef8ea39cb2d8d60057c1ea26d6e72b1.png?width=1200)
Photo by
penguin_yukikaze
Kaggle(Airline Customer Holiday Booking Dataset)をCode Interpreterで分析してみる
ChatGPTのCode Interpreterで先日Kaggleのタイタニック号の予測を行ったあとで気が付いたのですが、タイタニック号の問題はとても有名なので、ネット上に参考となる解説記事も多数存在するので、上手く動作したのではないかと思いました。
このため、今回はタイタニックよりは一般的ではないKaggleのデータセット(Airline Customer Holiday Booking Dataset)を使って、データ分析、モデルの作成をCode Interpreterで行ってみました。
結論として、チャット回数の制限さえなければ、Code IneterpreterはAutoMLの完全な上位互換として活用できる印象をもちました。データ分析の初手として、手早くデータの全体像を把握するツールとして活用できそうです。すごいというか少なくとも私は完敗です…😑
データの読み込み・可視化
![](https://assets.st-note.com/img/1688959950716-x1BVZ4S9BD.png?width=1200)
![](https://assets.st-note.com/img/1688960032410-kcXYsCGCMu.png?width=1200)
![](https://assets.st-note.com/img/1688960050906-Oe2LSjpLw9.png?width=1200)
![](https://assets.st-note.com/img/1688960130262-QzMtlFCXKj.png?width=1200)
予測モデルの作成
![](https://assets.st-note.com/img/1688960456941-NHIjf0hq2K.png?width=1200)
不均衡データの改善
![](https://assets.st-note.com/img/1688960549546-IP7KjcGRoN.png?width=1200)
![](https://assets.st-note.com/img/1688960725810-avlM4d61jE.png?width=1200)
特徴エンジニアリングの検討
![](https://assets.st-note.com/img/1688961461662-XkRjSBD1NP.png?width=1200)
![](https://assets.st-note.com/img/1688961495997-8N00WvCe6A.png?width=1200)
ややっ。ここでチャット数の制限に到達してしまいました。
ここまで所要、お昼休みの約30分弱で行うことができました。pythonもpandasも勾配ブースティングの実装も全く知らなくても、誰でもこの程度の分析が行える時代になってしまったというわけですね。😉
ご覧いただきありがとうございました。