AutoGPTの解説です。
00:13 自律型エージェントって何?
01:04 OpenAI APIキーの取得
01:58 Replitで紡ぎ出す。
02:30 どのヘッドホンがいいのか?
06:24 何が間違っているのでしょうか?
08:47 Tailwindは使う価値があるのか?
公開日:2023年4月21日
※動画を再生してから、インタビューを読むのがオススメです。
さて、自律型エージェントとは何でしょうか?
LLMを使って思考を連鎖させ、質問を思いつき、それを解決しようとするソフトウェアの一部です。
実際、この新しいパラダイムのAIソフトウェアは、何らかの研究をしている人や何かを成し遂げたい人にとって、本当に本当に有益なものです。なぜなら、自律エージェントはファイルシステムにアクセスでき、ローカルマシンにアクセスできるからです。
REPLを起動すると、クラウド上にあるそれぞれのコンピュータにアクセスできることを思い出すまで、私はほんの一瞬だけ恐怖を感じた。
つまり、REPL上で自律型エージェントを使用している場合、心配することはあまりありません。なぜなら、自律型エージェントがダメージを与えられるのは、自分自身だけだからです。
実際、先週リリースされた大物はAutoGPTです。
AutoGPTはGitHubのリポジトリで提供されています。
正直なところ、ローカル・マシンでそれを行う場合、セットアップに少々手間がかかる。
しかし、私たちの開発者アドボケートのおかげで、AutoGPTを数分で立ち上げることができる素晴らしい新しいテンプレートができました。
さっそく試してみて、自律型エージェントが実際にどんなことをやってくれるのか、探ってみましょう。
さて、もちろん、最初にしなければならないのは、OpenAIログインしてOpenAIキーを取得することです。
自分のプロフィールに行き、APIキーを見るをクリックすることでできます。
そして、もし作成したのであれば、それが何であるかを知っていることを期待します。
そうでなければ、新しいキーの作成をクリックし、名前をつけて、シークレットキーの作成をクリックし、これをコピーします。
無料アカウントに登録すると、最初の6ヶ月間は、APIコールに使用できる数ドルのクレジットが無料で手に入ることを忘れないでください。
それ以外の場合は、レプリカに戻ってこれをクレジットカードに接続する必要があります。
そして、AutoGPTをスピンアップするのがどれほど簡単なのか見てみましょう。
AutoGPTのテンプレートへのリンクをたどっていきます。
OpenAIのキーを非公開にしたい場合は、非公開にすることを確認してください。
フォーク処理はすぐに終わります。
さて、README.mdファイルには、セットアップのために何をすべきかが書かれています。
しかし、実際には、secretsにアクセスして、OpenAIのAPIキーをクリックせずに入力することが主な作業です。
そして、AutoGPTはすでに動作しています。
ほら、前のモデル(例1)を継続するかどうか聞いている。
これにはノーと言うしかありません。
そして、最初に名前をつけるよう促されるのがおわかりいただけるでしょう。
つまり、自分が何を求めているのかがわかったわけです。
では、この自律型エージェントは何に適しているのか、考えてみましょう。
自律型エージェントは、独自の研究を行い、物事に取り組むのに非常に適しています。
人間のようにGoogleやウェブブラウザを使って、何かを見つけたり、作ったり、結論を出したりするのは得意です。
しかし、物事を連鎖させ、質問を作り出し、答えを導き出すという点では、最も優れています。
まずは、とてもシンプルなことから始めてみましょう。
ある予算で最高のヘッドホンを見つけることです。
私たちは、その主な目標を与えます。
この場合、私の主な目標は、200ドル以下で最高のワイヤレスヘッドホンを見つけることです。
そして、いくつかの目標を私に尋ねます。
最初の目標は、200ドル以下で最高のヘッドホンを見つけることです。
ワイヤレスであること。
目標2:バッテリー寿命を最大にすること、ノイズキャンセリング機能があること、快適であること、頭の大きい人は美的感覚に優れていること、などなど。
さて、自律型エージェントは、考えることに多くの時間を費やしています。
これは、プロンプトを満たすために、またトピックのニーズを満たすために、質問を考え出すからです。
ここでは、質問、次にやりたいこと、推論、そして自分自身の批判を考えていることがわかります。
あなたがすべきことは、そのプロンプトに従うべきかどうか、イエスかノーかを言うことだけです。
誰かが「イエス」と言えば、その通りにしてくれます。
このように、記事を探し、ウェブで検索し、それをもとにさらに考え、分析することがわかります。
さて、なぜ毎回私に許可を求めるのか不思議に思うかもしれません。
その理由は、ご想像の通り、自律型AIエージェントがOpenAIのAPIにリクエストを送り返すと、かなり高価で、かなり速くなるからです。
このモデルはGPT 3.5で動作しているので、それなりに安価ですが、GPT-4で動作させると最良の結果を得ることができます。
GPT-4は非常に高価な実行方法です。
GPT-4は非常に高価な動作方法です。もし私たちが、そうだ、やってみよう、と言って好きなだけ動作させていたら、気づかないうちに請求書が溜まっていたかもしれません。
私は今、「続けろ」と言って、少しばかり続けてみようと思っています。
もう10回くらいリクエストしてみようかな。
このように、理由と数字の旗を使うことで、何度でも「続けろ」と指示できることがおわかりいただけると思います。
さらに10回反復し、10回の思考プロセスを経て、何が得られるかを確認するのです。
自律型エージェントは完璧ではありません。
まったく新しい技術です。
実際、AIソフトウェアにおける全く新しいパラダイムなのです。
つまり、現時点では、ちょっとしたマッサージや手助けが必要で、ウサギの穴に入り込んでしまうこともあるのです。
私が初めてこのソフトに出会ったとき、「英国で最も優れたコンピュータサイエンスのGCSEはどれか」という大きな研究プロジェクトを依頼しました。
すると、私が止めて正しい道に戻るように促すまで、学位レベルの資格という巨大なウサギの穴に入り込んでしまったのです。
今のところ、このようなものには多くの子育ての必要がありますが、まだ生まれて1週間です。
だから、それはフェアだと思う。
なるほど。
では、シャットダウンしているのですね。
結論は出たのでしょうか?
それでは、最終的に、バッテリーの寿命やいくつかの大きな頭のための快適さを含む、各オプションで遠くの研究をまとめた後、オーディオテクニカATH MX50X BT2が最良の選択であることを決定したものを見てみましょう。
40時間の電池寿命だけでなく、頭の大きい人でも快適に使えるレベルであることも知られています。
それは私です。
さらに、全体的な音質が優れていると言っているのは、ユーザーです。
これは素晴らしいことです。
というか、私は買い物に行くとき、最高のものが欲しいと思ったら、普通は何時間も何時間もかけて、ある基準で物事を調べ、レビューを比較します。
この自律型エージェントは、世界で最も効率的なものではないかもしれませんが、そのようなことをやってのけて、勝手に結果を出してくれるのです。
私は、自分の時間を使ってもっと生産的な別のことをすることができたかもしれないのに。
これは驚くべき新技術ですが、他にどんなことができるのか見てみましょう。
なるほど。
ずっとやりたかったんだけど、なかなか時間がなくて実現できなかったことを、ここでやってみます。
Rippleの中にAudioというフォルダを作り、その中にMP3ファイルをたくさん入れています。
Rippleで実現したいのは、RSSポッドキャストフィードで、自分で落としたオーディオファイルを携帯電話に取り込むことができる。
しかし、ポッドキャストのフォーマットについて調べたり、XMLファイルを作成したり、正しく動作させるために時間をかけたりしたことがありませんでした。
そこで、AutoGPTが私のためにこれをやってくれるかどうか試してみることにしましょう。
というわけで、これがうまくいくとは全く思えないのですが、わかる範囲で問題の概要を説明します。
オーディオ・フォルダーを自動的にスキャンして、iTunesと互換性のあるXMLファイルを作成し、それをオンラインでホストしてほしいのです。
また、Podcast.pyというファイルを作成し、自分で実行できるようにしたい。
これはかなりクールです。
まず最初に、拡張ライブラリの検索を行います。
もう一度言いますが、私はYを実行し、おそらく10回のチャンスを与えて、物事を動かすようにするつもりです。
これが面白いんです。
これは実際にファイルシステムで何かをしようとしているのです。
さて、最初に作ったpodgen.pyはうまくいかなかったので、違うものを試しています。
これは面白いです。
Rippleでのライブラリのインストールはパッケージマネージャを使うのが一番良いので、これは完全に正常です。
もちろん、Rippleで動作していることは知りません。
もちろん、Ripple上で動作していることは知りませんし、パッケージマネージャが利用できることも知りません。
では、もう一度これを実行し、続けてみましょう。しかし、今度は少し違った方法でプロンプトを出してみましょう。
このまま続けて、今度はpipを使おうとしたら、そうしないように指示します。
この場合、Podgenライブラリで行き詰っていることがわかります。
では、別のものを使うように指示したときにどうなるか見てみましょう。
ループにはまり込んでいるのがわかりますが、これは現在、このようなライブラリによくある問題の1つです。
何をすべきか一応はわかっているのですが、ちょっと難しくて苦労しているようです。
そこで、いくつかフィードバックしてみます。
ここでも、少し混乱しています。
feedgenがインストールされているかどうかを確認しようとしているのですが、実際にはそうなっていないのです。
ちょっとループにはまりそうですが、この可能性を見てください。
このループから抜け出すことができれば、実際にすべてをセットアップし、すべてを構築することができるようになります。
でも、ちょっと違うことをやってみましょう。
最近、Tailwind .cssについてよく耳にするようになったので、それを使うべきかどうか、正当化できるかどうか見てみましょう。
Tailwind.cssとは何か、類似品と比較し、長所と短所を列挙して、これを使うことに変更する価値があるかどうかを教えてほしいということです。
そして、Tailwind.cssが何であるかを知るための最初の一刺しとして、妥当な仕事をしたことがおわかりいただけると思います。
次に、いくつかのウェブサイトを閲覧して、それについて少し調べてみることにします。
GPTで使用できるトークンの量よりも大きなウェブサイトがあり、チャンキングを使ってさまざまな部分に要約しています。
つまり、そのような理解をしているのです。
そして、これが自律型エージェントが優れている理由です。
RLMの制限を回避して、実際に物事を考えさせ、基本的に思考を連鎖させているのですから、実際に見てみると本当にすごいことです。
このように、RLMの長所と短所をファイルに書き出しているのがおわかりいただけると思います。
出力フォルダを見てみてください。
このままバックグラウンドで作業させます。
すでにこの文書が生成されています。
長所と短所、これは素晴らしいことです。基本的に、これまでの研究のエグゼクティブ・サマリーを手に入れたのですから。
マークダウン・テーブルも作成してくれましたか?
そうです。
プレビューでそれを開いて見てみましょう。
うわー、これはかなりクールだ。
実にクールだ。
どこにあるのか見てみましょう。
おお、これは面白い。
LLMの要約がどこまで正確なのか、実際にLLMに質問しているんですね。
自分の仕事をチェックするいい方法でしょう?
永遠に続くわけではないので、判断を仰ぐだけですが、これでよしとしましょう。
まあ、実際、かなりクールな例で、しばらく続けられたかもしれませんが、これが自律型エージェントの良さなんです。
私自身はその時間を使っていません。
私自身がその時間を費やしているわけではありません。私は、データを取得し、他のことをするために100回のチャンスを与えることができます。
実際、レポートを常にオンにしておけば、いったん閉じて、また別の機会に戻ってきて、何が起きているのか見ることができます。
このようなことができるようになり、自動化できるようになったのは驚くべきことです。
実際、私たちはこのツールでできることの最先端にいるのです。
実際、このソフトでやろうとすることは、おそらく誰もやったことがないようなことでしょう。
実際、昨日、私がこのソフトを使ってイギリスのGCSEコースを比較したところ、アカデミックなコースを比較したのはおそらく初めてでしょう。
このようなことは1週間前のことです。
すごいことです。
Repletにアクセスして、テンプレートをフォークし、オープンAPIキーを入力して、自律型エージェントがあなたのために何ができるかを見てみませんか?
そして忘れてはいけないのは、Repletの本当に素晴らしいところは、携帯電話のモバイルアプリからこれらすべてを実行できることです。
実は、次にやるのはこれなんです。
自律型エージェントが得意なことといえば、それは研究ですからね。
そして、お分かりのように、私は休暇に戻る間、真剣に少し研究する必要があるのです。
それではまた次回、お会いしましょう。