見出し画像

Kaggle(Airline Customer Holiday Booking Dataset)をCode Interpreterで分析してみる

ChatGPTのCode Interpreterで先日Kaggleのタイタニック号の予測を行ったあとで気が付いたのですが、タイタニック号の問題はとても有名なので、ネット上に参考となる解説記事も多数存在するので、上手く動作したのではないかと思いました。

このため、今回はタイタニックよりは一般的ではないKaggleのデータセット(Airline Customer Holiday Booking Dataset)を使って、データ分析、モデルの作成をCode Interpreterで行ってみました。

結論として、チャット回数の制限さえなければ、Code IneterpreterはAutoMLの完全な上位互換として活用できる印象をもちました。データ分析の初手として、手早くデータの全体像を把握するツールとして活用できそうです。すごいというか少なくとも私は完敗です…😑

データの読み込み・可視化

データ分布の可視化
予約成約傾向の可視化
データ分析結果の考察

予測モデルの作成

モデルを評価して改善点を提案

不均衡データの改善

ライブラリが不足していても自前でサクッと何とかしてくれる(カッコイイ)
かなり改善されました。

特徴エンジニアリングの検討

ややっ。ここでチャット数の制限に到達してしまいました。

ここまで所要、お昼休みの約30分弱で行うことができました。pythonもpandasも勾配ブースティングの実装も全く知らなくても、誰でもこの程度の分析が行える時代になってしまったというわけですね。😉

ご覧いただきありがとうございました。

いいなと思ったら応援しよう!

この記事が参加している募集