AutoGPTの解説です。
基本的な機能からより高度な機能まで、AutoGPTについて知っておく必要があることを紹介しています。
00:00 - イントロダクション
01:37 - AutoGPTって何?
03:08 - 特徴
03:34 - 必要なソフトウェアをインストールする
04:18 - APIキー
05:28 - インストール
06:46 - コードの編集
08:12 - APIキーの入力
10:51 - デモ
12:00 - ボットに音声を追加する
公開日:2023年4月27日
※動画を再生してから読むのがオススメです。
AIエージェントとの会話だけでピザを注文できるなんて、想像してみてください。
まあ、それこそAutoGPTを使って誰かがやったことなんですけどね。
見てみてください。
こんにちは、私はあなたのためにここにいます。
何をされたいのでしょうか?
ピザを注文したいです。
注文したいピザの種類は?
11インチのペパロニピザ、レギュラークラストです。
なるほど、素晴らしい。
まず、あなたの地域で美味しいピザ屋さんを探すために検索します。
今度はTwilioの音声APIを使ってピザを起こし、あなたにピザを注文してみます。
こんにちは、11インチのレギュラーペパロニピザの受け取りをお願いします。
さて、すごいと思いませんか?
さて、今日のビデオでは、実際にAutoGPTエージェントをインストールする方法を紹介したいと思います。
AutoGPTエージェントを使えば、様々なタスクを一緒にこなしたり、サポートが必要なタスクを手助けしたりすることができます。
今日のビデオでは、インストール方法を紹介するとともに、AutoGPTとは何か、音声音声認識AIエージェントをどのように導入できるかを分析します。
そう考えると、実際のビデオの要点に入る前に、実際のアプリケーションの分析について詳しく説明している私の AutoGPT ビデオをまだ見ていない場合は、ぜひチェックしてください。 以下の説明にリンクを残しておきます。
そして、他のリンクについても、下の説明に書いておきます。
私の以前のビデオをチェックアウトしていない場合は、多くの価値があり、間違いなく恩恵を受けるコンテンツがたくさんあります.
もし購読しているなら、ぜひ購読して、通知ベルをオンにして、このビデオに「いいね!」してください!そう思って、さっそく本題に入りましょう。
さて、AutoGPTとは何でしょうか?
インターネット上では、このアプリケーションについて多くの熱狂がありました。
その正体は、自律型AIエージェントアプリケーションで、GPT-4言語モデルの能力を実証する実験的なソフトウェアアプリケーションです。
GPT-4を知らない人のために説明すると、GPT-4は先進的な人工知能システムで、与えられた入力に対して人間のような応答を生成することができます。
AutoGPTは、この技術の可能性を示すために設計されており、ユーザーはシステムが自律的に達成するための目標や目的を設定することができます。
このプログラムは、言語モデリングと呼ばれる機械学習の一種を使用するGPT-4によって駆動されます。
つまり、大量のテキストデータを分析し、与えられた入力に続く最も可能性の高い単語やフレーズを予測するように学習するのです。
この機能を使えば、設定した目標の達成に向けて、思考を連鎖させることができるようになります。
これは、この小さなデモで確認することができます。
AutoGPTがユニークなのは、人間の介入を受けずに自律的に動作することです。
つまり、自らの内部プロセスのみに基づいて意思決定し、行動を起こすことができるのです。
GPTが完全に自律的に動作する最初の例の1つとして、皆さん、これは以前、私のビデオで取り上げたもので、もっと深く掘り下げたものです。
ですから、ぜひご覧になってください。
ローカルにインストールしたくないという人のために、私が話したアプリケーションとビデオもあります。
さて、実際にインストールする前にお話ししたいのは、インターネットにアクセスできること、長期・短期のメモリー管理ができること、などです。
GPT-4は、基本的にテキスト生成のために実行される接続で、その他の機能でさらに多くのことを行うことができます。
さて、実際に自律型AIエージェントをインストールするために必要なものですが、まず最初に、Gitをインストールしておく必要があります。
これは、リポジトリをデスクトップにクローンするためのものです。
これは、持っているCPUやプロセッサに関係なく行えます。
次に、Pythonが必要です。
Pythonは、実際のプロンプトやAIエージェントアプリケーションのコードエディター、すみません、実際のコードエディターになる予定です。
つまり、アプリケーションを実際に実行するために必要なものです。
そして最後に、Visual Studio Codeも必要です。
これはオプションです。
もちろん、実際のプロセッサに付属しているコードエディタを使用することも可能です。
しかし、私の場合、Visual Studio Codeは非常に魅力的で、使い勝手の良いものです。
ですから、ぜひ入手してください。私のおすすめです。
もうひとつ、残高のあるAPIキーも持っておく必要があります。
価格については、インストールも支払いも非常に簡単です。
このAPIキーはそれほど多く使う必要はありません。
この実際の実験では、おそらく最大で5ドル程度かかると思いますので、非常に安く、実際にできることを紹介しますので、絶対にインストールしてください。
Pineconeに関しては、これもAPIキーで、実際にこのウェブサーバーでメモリ、短期メモリ、長期メモリをホストするために必要なものです。
そのため、Pinecone から無料の API キーが設定されていることを確認してください。これは、簡単にインストールして無料でアクセスできるものです。
そして最後に、AIエージェントに音声認識システムをインストールする場合、AIエージェントに音声認識システムのための同社の無料APIキーを使用することになるので、ElevenLabsの実際のアプリケーションまたはアカウントがインストールされていることを確認したいのです。
さて、これは私が実際に話した別のビデオです。興味があれば、そのリンクを以下の説明にも残します。ElevenLabs についてもう少し説明します。
それでは、次のステップで実際のAIエージェントのインストールについてもう少し詳しく説明します。
さて、インストールの時間です。
GitHubのリンクはこのままにしておきますので、これからすることは、コードをクリックしてリポジトリのリンクをコピーすることです。
そうしたら、コマンドプロンプトを開き、ここからデスクトップにクローンを作成します。
cloneを開き、リンクを貼り付け、Enterをクリックします。
これで、ローカルデスクトップにファイルがインストールされます。それが完了したら、CD AutoGPTと入力してAutoGPTのフォルダをクリックし、Enterをクリックします。
これから行うのは、このファイルのパッケージをデスクトップにインストールすることです。
次のステップに進みますので、ここでお見せします。
そこで次のステップで、要件を実際のフォルダにインストールすることになりますが、これが貼り付けるコマンドになります。
これは下の説明に残しておきますので、簡単にできますね。
やりたいことはEnterをクリックすることで、それが完了するとパッケージのインストールが始まります。
次のパートでは、実際にVisual Studio Codeを使って、実際のパッケージの解凍を開始することになりますね。
インストールが完了したら、Visual Studio Codeを開くことができます。
やりたいことは、このボタンをクリックして、フォルダを開くことです。
それが終わったら、一旦開いてから次のパートに進みます。
開いてしまえば、作者を信用することができます。
.env.templateファイルに移動してください。
ここでやりたいことは、名前を変えて、テンプレートを取り出すことです。
テンプレートを取り出したら、そのファイルを保存します。
これでAPIキーとElevenLabsキーの入力が開始されます。
Pine Coneを短期記憶と長期記憶の保存に使うのであれば、こちらも入力します。
それが終わったら、次のステップに進み、どこに入力すればいいのか、また、そこからさまざまなプラグインやさまざまな機能を入力することができます。
これは、この実際のアプリケーションの素晴らしいところです。
このアプリケーションで実際に身につけることができるいくつかの文書について話しています。
あなたは実際にウェブ検索インストールを持つことができます。
また、Pine Coneのようなメモリインストールも可能です。
ウェブ検索の面では、GoogleのAPIシステムを組み込むこともできます。
つまり、Googleでウェブ検索ができるわけです。
あと、できるのは音声TTSで、これはElevenLabsですね。
これは、このAPIキーでインストールすることになりますね。
画像生成もできるもので、この実際のアプリケーションにはさまざまなユースケースがあります。
その機能をフルに使いたいのであれば、全部入力すればいいと思います。
でも、私の場合は、メモリと音声の方だけをやることにしています。
というのも、いろいろなものを取り入れるつもりはないからです。
このエージェントを小さな下働きに使うつもりなので。
私が行ったのは、オープンAPIキーを入力することです。これはactualopenai.comから取得できるもので、このリンクは下の説明に残しておきます。
前に話したのは、クレジットがあることを確認したいということです。
自分の秘密鍵を作るのです。
自分のクレジットカードを追加して課金セクションにアップロードしたら、この実験やこのアプリケーションで実行する実際の雑務に使うトークンの上限を設定することになるのです。
それが済んだら、キーをコピーしてください。
オープンAPIキーを貼り付けることができます。
もちろん、私のものをコピーしようとしてはいけません。このビデオの後でこれをオフにするつもりなので、試さないでください。
また、異なるLMSを使用するという点で、Azureのキーを入力することもできます。
いろいろなものをプラグアンドプレイできます。
さて、記憶ということで、自分の松ぼっくりキーを入力し、自分の環境を入れてみました。
これは、自分のpineconeの実際のデータスペースで取得できるものです。
無料アカウントを作った後にAPIキーのところに行くと、自分のキーをコピーして、環境をこちらにコピーすることができます。
そして、環境のあるところに貼り付けて、APIキーのあるところに貼り付けることができます。
さて、スピーチの面では、今はまだお見せできません。
なぜなら、実際にどのように設定し、実際のAIエージェントを動かしてみるかを紹介したいからです。
また、温度や、LLMモデルで使用する実際のパラメータを弄ることもできます。
これは実際に遊んでみることができますし、使い方のデモもあります。
Dockerシステムにインストールしてもらうか、提供されるイメージ生成システムを持ってください。
GitHub APIキーや、Google、Firefox、Chrome、Safariを使ったウェブブラウジングで、Hugging Faceの音声テキスト化プロバイダーで遊ぶこともできます。
また、TTSプロバイダーを使うこともできます。
もうひとつは、Twitter APIと、サードパーティ企業のプラグインを実際のアプリケーションに組み込むことができる許可リストです。
このプラグインは、複雑なトレーニングや複雑なタスクに対するソリューションを提供するために、アプリケーションをさらに強化するもので、これもビデオで公開する予定です。
さて、これらのAPIキーをすべて入力したら、保存をクリックします。
次に行うことは、main.py Python フォルダまたはファイルに移動することです。
Visual Studio Codeの右上にある'Enter'をクリックします。これで、実際のアプリケーションのターミナルを実行し始めます。
この準備ができたら、ファイルのダウンロードを開始し、実行する準備ができたら、あなたに連絡します。
しかし、それが終われば、基本的に次のセクションに進むことができます。"Welcome to AutoGPT "と表示されます。
AIアシスタントを作成するには、"/manual mode "と入力するか、実際のAIに名前を付けて始めることができます。
さて、何ができるかというと、今回は起業家GPTの例がありましたので、そのAIの役割を説明することができます。
この場合は、純資産を増やすことだけを目標に、自律的にビジネスを開発・運営するように設計したそうです。
そして、AIと一緒に5つまで目標をアップロードすることができます。
この場合、それぞれの目標の間にカンマを入れて1、2を入れ、エンターをクリックします。
特定の目標が設定されていない場合、または特に 5 つの目標がない場合は、それを 3 つまたは 2 つなどに減らすこともできます。
さらに目標がある場合は、その後に別の目的を入力することもできます。
以上で、実際に自分のエージェントを運営する方法は終了です。
これは非常に簡単です。
これから紹介するのは、実際に11の研究室の様子や、AIエージェントにスピーカーを設置する方法です。
それでは、次のセクションでは、実際にあなたに話しかけるAIシステムを実装してみましょう。
ということで、以下の説明でElevenLabsのリンクを伏せておきますね。
基本的に、やりたいことはリソースに行き、ドキュメンテーションに入りたいのです。
ここで、APIキーを設定し、無料アクセスを開始することができると思います。
もちろん、これはインストールして、ElevenLabsの実際のアカウントにアクセスできるようになった後の話です。
ですから、この他のタブは開いたままにしておいてください。
右上のアイコンをクリックし、「プロフィール」をクリックし、「プロフィール設定」をクリックします。
自分のキーをコピーしてください。
それができたら、先ほど編集したactual.nフォルダに移動してください。
これをここにコピーします。
これで、自分の声や他の人の声を再現するために、異なる音声IDを入力することができます。
ボイスの中に入って、ここにボイスを入れることができるのです。
このように、さまざまな目的、さまざまなラベルを設定することで、さまざまな調整を行うことができます。
ですから、これは明らかに、さまざまな声があるので、調整するために多くの時間を得る必要があるものなのです。
特定のボイスを手に入れたら、そのボイスコピー、つまり実際の環境のコードを入手して、こちらのボイスIDセクションに貼り付けることができるのです。
基本的なAIエージェントには、複数の異なる音声を出力させることも可能です。
これが、AIアシスタントの設定方法の一例です。
このビデオは非常にユニークで、将来的に多くの複雑なタスクを解決する自律型エージェントであるため、皆さんにとって有益なものであったかと思います。
このアプリケーションをどのように使うか、さまざまなケースを想定して、さまざまなタイプのビデオやデモを作成してほしいということであれば、ぜひそうしましょう。
ElevenLabsと同様にAutoGPTの分析ビデオのように、私は下の説明ですべてのリンクを残しておきます。
ということで、皆さん、見てくれてありがとうございました。
私の他のビデオもチェックしてみてください、皆さんの役に立つコンテンツがたくさんありますから。
今日のビデオで話したビデオをまだ見ていない人は、ぜひチェックしてみてください。
購読して、通知ベルをオンにして、このビデオに「いいね!」してください!それが私にとって本当に大きな意味を持つからです。
素晴らしい一日を、素晴らしい小さな一日を、そしてまた後で会いましょう。
それではまた。