見出し画像

PandasAI:次世代の分析ツール

まだ開発途上のPandasAIのようですが、どのようなものかPandasAIのブログを参考にコードを真似てみました。ブログには次のように書かれていました。

「この革新的なツールは、データ分析タスクを大幅に強化し、より速く、より効率的に、そして実に楽しいものにするように設計されています。」

「Pandas は、10 年以上にわたって構造化データの操作と分析に頼りになるツールです。しかし、データセットはますます大きくなり、より複雑になるため、これらの課題を簡単に処理できるツールが必要です。そこで PandasAI が登場します。」

感想としては、これが進化して、言葉でデータから洞察、インサイトが得られるようになれば、Pandasの関数やメソッドは覚える必要性が薄れていくだろうなと。。。

ここでは架空の二酸化炭素排出量を使って可視化してみました。

!pip install pandas==1.5.3 pandasai==0.6.7
import pandas as pd
from pandasai import PandasAI
from pandasai.llm.openai import OpenAI

#pandasを使ってデータフレームを作成
df = pd.DataFrame({ "country": ["United States", "China", "India", "Russia", "Japan"], "emissions": [round(5269.480), round(10065.36), round(2654.628), round(1711.24), round(1162.55)], "rank": [2, 1, 3, 4, 5]})

#llm(ここではOpenAI)をインスタンス化。
OPENAI_API_KEY = "YOUR OPENAI_API_KEY"
llm = OpenAI(api_token=OPENAI_API_KEY)
#次に、大規模言語モデル(llm)を用いてPandasAIをインスタンス化、データフレームとプロンプトを渡して実行。
pandas_ai = PandasAI(llm)
pandas_ai.run(df, prompt='Which country has the fifth highest emissions?')

PandasAIの答え 'Japan'

#ヒストグラムを表示
pandas_ai.run(df, "Plot a histogram of countries showing their respective emissions in order of emissions, using different colors for each bar.")


#パイチャートを表示
pandas_ai.run(df, "Plot a piechat of countries showing their respective emissions in order of emissions, using different colors for each pie.")




いいなと思ったら応援しよう!