![見出し画像](https://assets.st-note.com/production/uploads/images/156100184/rectangle_large_type_2_671c887f78456a966846d7b70d10a70d.png?width=1200)
Photo by
featurecompass
生成AIによるデータ分析の考察-ChatGPT o1、Llama-3.2
今回は、ChatGPT o1-previewとLlama-3.2-3Bを使用して、データ分析について考察してみます。
まだまだ、生成AIによるデータ分析は発展途上だと考えていますが、数年以内にそれなりのところまで行くのだと予想されますが、現時点でどのようなものか確認してみます。
今回は、次のようなcpuデータをChatGPT o1-previewと、Llama-3.2-3Bに読み込ませて分析してもらいます。
![](https://assets.st-note.com/img/1727598030-mtDORli7Mkf8g3K1s0puBaNz.png)
A列に、タイムスタンプと、使用率が記載されています。
最初に、このcsvファイルをChatGPT o1-previewに読み込ませて分析してもらいます。
![](https://assets.st-note.com/img/1727598262-9se1ycdNJV3S4CqIv5QOnp6Y.png?width=1200)
グラフ化してくださいと言うと、グラフも作成してもらえます。
![](https://assets.st-note.com/img/1727598315-LeJUMf5oWxanh3SBcgltm1d0.png?width=1200)
次に、Llama-3.2-3BにLMStudioに取り込んで分析してもらいます。
![](https://assets.st-note.com/img/1727598773-SCty0dm15A4k9zniZuYRKwr8.png?width=1200)
Llama-3.2-3Bの方は、望んだ回答ではなかったです。
30億パラメータだと厳しいのかなと思い、もう少し上のパラメータを利用して分析すれば違う結果になったのではないかと思われます。
考察としては、データ分析にも生成AIは利用できます。
但し、主要な生成AIプラットフォーマーの生成AIを利用するか、ローカルLLMならパラメータ数の大きいローカルLLMを利用しなくてはならないのではないかと考えれれます。
また、Prompt次第だとは思いますが、Pythonで統計的な数値解析は出来るでので、このデータからどういうことが言えるのかまで踏み込んで回答してくれると応用の幅が拡がる気がします。
例えば、CPU使用率がひっ迫していた場合に、単なる数値解析だけに終わらずに、ひっ迫の原因になるアプリを特定する方法を提示して、そのアプリを停止させましょうなどが提言できると面白い気がします。