ChatGPTでデータ分析の生産性2倍くらいかな、と思ったら10倍になりうる記事を発見したのでその調査など(Noteableプラグイン, ChatGPT部, 大城)
こんばんは、ChatGPT部、部長の大城です。金曜の夜、皆様いかがお過ごしでしょうか。
今日私が所属しているデータサイエンティスト協会九州支部の定例会議にて、グッデイの宮田さんから「大城さん、この記事知ってますか?」と教えて頂いた記事がめっちゃすごかったので、まとめております。細かな部分を除けば生産性10倍、いけるのではないでしょうか。
紹介された記事:「データ分析の効率が10倍上がるデータサイエンティストのためのChatGPTの活用術」(tw:@A7_dataさん)
これ、本文読んでもらうとわかる人にはわかると思うのですが、「サンプルデータ作成」「データ抽出(SQL)」「予測モデル構築」「制度改善」「データ可視化」をほぼ全てChatGPT(と、プラグイン)で実現されていましたので、あーこれはタスクによっては生産性10倍もあながち間違いではないな、と思ったのでご紹介です。なお、今回はその中で取り上げられていた「Notable」プラグインについて取り上げます。
( おそらく、より具体の話は本家のQiitaを書かれている「A7@データサイエンティスト×マーケ目指してる大学生」さんの記事やtwitterを追われるのが良いと思います )
ご本人のtwitterはこちら。
Notableプラグインを触ってみる
先ほどの記事で@A7_dataさんがご紹介されていましたNotableプラグイン、少し触ってみようと思います。
とりあえず、プラグインをインストール
まずはプラグインインストール。というか1週間見ない間にめっちゃ増えてませんか・・??(70 -> 132 -> 224くらい?あと検索窓ついてました)
Notable入れようとするとアカウント連携してや、と言われましたのでこちらも対応。
これで準備完了ですね(ChatGPT-4のプラグインで指定)
ChatGPT自身にNoteableの使い方を聞く
よくわからないことはChatGPTに聞きましょう。プラグインの場合入れているものならおそらく使い方の説明があるはずです。
ChatGPT自身に聞いてみた結果がこちら。というか、DB接続いけるの・・!?(これはこれで驚愕・・)
ChatGPTにプラグインのデモをしてもらう
プログラミング言語あるあるですが、多くの場合は実行例というものも用意されています。多分、ChatGPTのプラグインにもあるはずなので、ここも聞いてみましょう。
デモの依頼。ノートブックの作成。
次に、Pythonでコーディング。
そして、実行。
コード修正
本家本元のノートブックはどうなっているか?
実は先ほど、ノートブック作成時に該当のhttps://app.noteable.io へのリンクが出力されていましたので、そちらにアクセスしてみました。
その結果が以下です。google colabのような感じのサービスですね。
修正後のコード、「Hello, OpenAI!」が出力されていることが確認できました。
コードインタプリタの機能が将来的にはChatGPTに組み込まれるようですが、その前でもnotebookサービスと連携すればPythonコードの実行もできそうですね。
もう一つ気になっている、DB接続・・
こちら、めっちゃ気になってるんですよね。ただ、いい感じの接続可能なDBが手元にないのでどうしたものかなと。
とりあえず一度ChatGPTに相談してみましょうか。
SQLiteの利用、いいですね。テキストファイルベースのデータベースで、SQLが使えます。
テーブル生成とデータ挿入(今回は1レコード)
実行
データ抽出
実際の実行環境の画面(Noteable)
ちゃんとcreate tableやinsert文も動いてますし、selectで抽出もできてますね。
DBに関してはもっと色々試してみたい気もしますが、一旦この記事ではこの辺りにしておきます。(多分、テーブルの構造を渡して条件に合ったデータを抽出するSQLの出力、とかもいけるはず。どの程度の性能かは追々検証してみたいと思います。)
所感:自由度の高いプラグインは夢広がる
前々からCahtGPTという頭脳にコンピュータやインターネットを与えたらかなりできることは広がるだろうなと思っていましたが、まさか標準のChatGPTにプログラム実行環境であるコードインタプリタが配布される前に、プラグインで一部その類似機能が使える、というのは驚きでした。というかまだプラグインが公開されて2〜3週間くらいだと思いますので、かなり早い。
プログラミング言語の実行が可能になれば、他のAPIとの連携なども容易になりますし、特にデータ分析の領域ではかなり力を発揮するのではないでしょうか。
また個人的には「データベースアクセス」のプラグインがないのかずっと気になっていましたが、まさかこんな形で発見する事が出来るとはほんと幸運でした。
現状のChatGPT-3.5や4は短期記憶できるトークン数に上限があり、またファインチューニングも結構難易度が高いようなので、多くの情報からデータを引っ張ってこれるDBアクセス系のプラグインはかなりありがたいなと思いました。これで利用規約のDBや、業績情報のDBなどから必要な情報の抽出・分析を日本語・母国語で伝え、SQLを実行してもらい、そのDBから戻ってきた結果を集約・可視化・考察してもらう事が可能になります。
(いや、ほんと進化が早すぎてもうこれ以上早くなると追いつけませんね・・)
という事で今回は簡単に「Noteable」プラグインの使い方、またDBアクセスもできるよ、というご紹介でした。いやー、ほんと夢が広がりますね。
また今回参考にさせて頂きましたQiitaの元記事をかかれました@A7_dataさん、またその情報を教えていただきましたグッデイの宮田さんには感謝です。
という事でみなさんもどうぞ良いChatGPTライフを・・! (大城)