【生成AI】BabyAGIの環境構築をしてみました
昨日に続いて、BabyAGIに関する記事を書きます。ウェブで調べていたところ、BabyAGIはコマンドベースで利用するプログラムであることがわかりました。
そしてさらに調べてみたところ、WebUIで利用できる、BabyAGI‐WebUIというプログラムが公開されていましたので、今回はこちらの環境構築を行います。
環境構築に挑戦
Mac OSを使用して環境構築を行います。Windowsで環境構築をされる場合は、今回ご紹介する方法とは異なる場合がありますのでご注意ください。
インストールするディレクトリを指定
事前にインストールしたいディレクトリを作成して任意のディレクトリ名を決めました。
ターミナルを開いて、cd XXXX を入力して作成したディレクトリの移動します。(XXXXはディレクトリ名)
私はユーザー/BabyAGIにて作業をすることにしました。
Githubにアクセス
BabyAGI‐WebUIは以下のページにて公開されています。
こちらのページを表示して、下へスクロールすると、How to Useがありますので、手順に従って、インストールを実行します。
ターミナルに git clone https://github.com/yoheinakajima/babyagi.git を入力するとインストールが開始します。
インストール完了後に cd babyagi-ui を入力してディレクトリを変更します。
ディレクトリ変更後に npm install を入力して、npmというパッケージ管理ツールをインストールします。
npmインストール完了後に cp .env.example .env を入力して環境ファイルを作成します。
最後に npm run dev を入力するとBabyAGIがウェブ上で利用できる状態になります。
ウェブブラウザを開いて http://localhost:3000 にアクセスし、ChatGPTのような画面が表示されればインストールは完了です。
BabyAGI-WebUIの設定
http://localhost:3000にアクセスしてBabyAGIの画面を表示したら、設定を行います。
モデルを選択
モデルはGPTのバージョンを選択します。バージョンは以下の3つから選択します。
GPT3.5 Turbo
GPT4
GPT4 Turbo
GPT4やGPT4 Turboは利用料金が割増になるので、まずはGPT3.5 Turboにて動作確認をされることをオススメします。
次に、左下の歯車のマークをクリックして設定をします。
設定はOpenAI API キーにAPIキーを入力するだけです。
OpenAI APIキーの取得方法とBabyAGI-WebUIへの設定
OpenAI APIキーとは、ChatGPT以外でGPTの機能を使うために必要となるチケットです。
GPT自体は自作のプログラムなどに組み込んで利用することができて、このチケットをプログラムに組み込むことで、質問の理解と回答の生成の部分のみOpenAI社のサービスを利用することができます。
ただし、このチケットは使用量に応じて課金されるため、ChatGPTのように定額での利用はできないということに注意が必要です。
では、APIキー取得手順と設定方法を説明します。
OpenAIのアカウントを作成し、ログインして以下のページにアクセスすると、API発行ページが表示されます。
https://platform.openai.com/api-keys
Create new secret key をクリックして、任意の名前を入力して Create secret key をクリックします。
すると、APIキーが生成・表示されるのでコピーします。
コピーしたAPIキーをBabyAGI-WebUIの設定画面のOpenAI APIキーに入力して 保存 をクリックします。
これで設定は完了です。
実行したいタスクを入力する
ここまでの設定が完了したら、実行したいタスクをページ下の入力欄に入力して、▷をクリックするとBabyAGIが自動でタスクを開始します。
基本的にはタスク完了まで自動で行うため、使用量が増え続けます。
タスクの進捗を確認して、入出力が多くなることが予想できた場合には手動でタスクの停止をしましょう。
まとめ
今回はWebUIで利用できるBabyAGI-WebUIの環境構築を行いました。
Githubページに書かれている手順を進めて、APIキーの設定をすると利用ができるので、コマンドベースで利用するものと比較すると、かなり簡単に環境構築ができました。
APIキーを利用することによる従量課金制なので、利用料金が気になりますが、実際に使用した結果や金額を改めて記事にまとめます。