LangChainの解説です。
公開日:2023年4月25日
※動画を再生してから、インタビューを読むのがオススメです。
こんにちは、AIの世界のYouTubeビデオにお帰りなさい。
今日のビデオでは、LLaMAアカデミーを紹介します。
基本的には、GPT(generative pre-trained transformer)を教えることを目的とした新しいプロジェクトで、API用の大規模言語モデルであるLLaMAを使って、APIドキュメントの読み方を紹介するものです。
また、API用のLLaMAオラクルであるLoraや、言語モデルチェーンであるLangChainも利用しています。これは、以前私のビデオで紹介したものです。
このプロジェクトのゴールは、GPTがStripeやNotion、あるいは自社製品のAPIなどの新しいAPIを学習して使えるようにすることです。
そしてこれはかなり革新的です、皆さん。なぜなら、異なるAPIドキュメントをホストできるようになり、基本的には、さまざまな言語モデルやアプリケーションにコードを書き、特定のタイプのプロンプトを利用して、たとえばウェブサイトの生成を手助けする方法を教えることができます。
JavaScriptや、さまざまなソフトウェア開発者のためのさまざまなものに活用されるかもしれません。
しかし、そのような考えから、その要点に入る前に、私は多くのビデオと、あなた方にとって非常に有益かもしれない多くのコンテンツを持っているので、ぜひそれをチェックすることをお勧めします。
これからもアップロードを続け、常に最高のコンテンツを皆さんに提供するつもりです。
だから、私の他の過去のビデオもすべてチェックすることを強くお勧めします。非常に詳細で、間違いなくあなたのためになる価値がたくさんあります。
もしまだ購読していないなら、購読してもらえるととてもうれしいです。
通知ベルをオンにして、このビデオに「いいね!」して、今後のアップデートに望むことがあればコメントしてください。
ということで、さっそく動画に入りましょう。
さて、今回お話したように、LLaMA Academyは基本的にソフトウェア開発者にとって非常に価値のあるツールであると同時に、実現可能な可能性を持っています。
今日のビデオで説明することですが、皆さんにこれが何をしようとしているのかのデモンストレーションを見せ、もう少し分析について説明し、データがどのように流れているかを示すフローチャートを皆さんに見せ
インストールについても少しお話ししますが、これは研究用なので、インストール方法をお見せするつもりはありません。
基本的にはオープンソースですが、要件があるので、誰でもインストールできるわけではありません、後で少しお話します。
しかし、これは非常にハードウェアを必要とするアプリケーションなので、実際にこの機能をローカルデスクトップで実行するためには、さまざまな要件が必要になるかもしれません。
そこで、実際にこのアプリケーションを使う前に、このアプリケーションの分析とユースケースについてもう少しお話ししたいと思います。
先ほどもお話したように、基本的にはラマにコードの書き方を教え、GPTを使い、APIドキュメントを読むというものです。
ラマ・アカデミーのおかげで、開発者はこの作業を非常に簡単に行うことができ、自社製品のAPIを含め、さまざまなAPIを素早く学習して使用することができます。
また、NotionやStripeだけでなく、さまざまな種類のWeb APIや自社製品のAPIを利用することができ、多くのソフトウェア開発者にとって非常に有益なものとなっています。
LLaMA Academyを使えば、多くの人が不満に思っているAPIドキュメントのホスティングではなく、自分たちのAPI実装をホスティングすることもできます。
このプロジェクトはDaniel Grossが作成したもので、ぜひ皆さんもご覧になってみてください。
このプロジェクトはDaniel Grossによって作られました。
また、このプロジェクトに星をつけて応援してください。そして、もしあなたがそうできるのであれば、ローカルにインストールしてください。
APIドキュメントとスクリプトの実行は、もうひとつの大きな言語モデルであるLLaMAを通して行います。これは基本的にミニGPTのようなもので、開発者のサーバーでホストすることができ、ユーザーはこれを呼び出してさまざまなAPIグルーを生成することができます。
これにより、開発者はAPIに依存するソフトウェアを構築する際の時間と労力を大幅に削減することができます。このデモでは、このようなことをお見せします。
そして、Danielがやっていることは、基本的にLLaMAにAPIコードの書き方を教えることで、それはChatGPTプラグインだけでなく、モデルを微調整して、別のアプリケーションであるNotionと会話する方法を学び、そのAPIドキュメントを読むことで実際にこれを行うことができます。
そして、この例でそれを確認することができます。
パッケージと言語モデルをすべてインストールし、人間が行うのは、「Notion APIを使って、特定のページのコメントをすべて取得する」というプロンプトを出すことです。
アシスタントは、アプリケーションと同様にJavaScriptを使い、このコードを作成します。
そして最後に、実際のAPI概念を定式化することができ、このAPIを使ってNotionと会話することができ、このコードを取得することができることがわかります。
これは、彼らがアプリケーションで保持できたほんの一例にすぎません。
このように、APIに依存したソフトウェアを構築する際の時間と労力を大幅に削減することができるのは、非常に素晴らしいことです。
ですから、これは非常に驚くべきことで、これに興味がある方は、ぜひ見てみることをお勧めします。
しかし、これは彼らが継続的に取り組んでいることであり、現在まだ建設中であるため、今この瞬間にリリースされるものではないとさえ言われているのです。
ですから、実際に微調整して正式リリースされるまでには、まだ時間がかかりそうです。現在、建設中のため、真摯に取り組むためのパッケージすら公開されていません。
というわけで、次のステップに進み、フローチャートでその仕組みをもう少し詳しく紹介したいと思います。
LLaMA Academyのパイプラインが基本的にどのように機能しているかに関して、基本的には4つのステップがあります。それらは、クローリング、データ生成、ファインチューニング、デプロイメントで、このフローチャートでそれを確認することができます。
最初のステップであるクロールでは、実際のLLaMA Academyがウェブをクロールします。
この最初のステップは、次のステップであるデータ生成のためのデータを収集するために非常に必要です。
このデータ生成ステップでは、LLaMA Academyを使ってGPT-3.5を利用できます。これはOpenAIの無料版製品です。また、GPT-4モデルも利用しており、オープンAPIキーを提供する必要があるかもしれませんが、合成データを生成できるようになります。
そして、これによって何ができるかというと、収集したAPIドキュメントを使ってコードを生成し、最初のステップのスニペットや相対テキストも使ってデータを生成するのです。
そして、次のステップでVaikuna 13bのモデルを使って実際に微調整を行うのです。
そして、この次の微調整によって、前のステップで生成された合成データの微調整版を得ることができるのです。
このステップでは、モデルがコードを理解し生成する能力を実際に向上させるための重要なステップを踏んでいます。
これは、最初のステップであるクロールと関連しており、コードのために適切な情報を得るためにウェブサイトのデータから情報を取得します。
最後に、次のステップであるデプロイを行うのですが、これは何をするかというと、新しく微調整されたモデルを実際のサーバーでホストすることになります。
ローカルコンピューターを使用しているかどうかによりますが、ローカルデスクトップから取得するかもしれません。しかし、基本的にユーザーはモデルを見つけて呼び出し、最初のステップでクロールされたAPIのドキュメントに関連するコードを生成できます。
この例では、あなたが与えたリファレンスから始まり、さまざまなデータセットやウェブ上でそれを取得します。
この場合、GPT-3.5またはGPT-4を使用します。ここから、基本的にソースと合成データを見て、APIドキュメントの実際のコンテキストを生成します。
ここから、APIドキュメントであるベクターストアに送られます。当然、別のLLMに送ることもできますし、今回はVaikuna 13bモデルを使って、微調整をします。
それが終わると、最終段階として、新たに微調整されたモデルを実際のサーバーにホストするためにデプロイされるのですが、これを見ることができます。
このケースでは、Appleという銘柄の20日移動平均を計算するように指示されています。
これはAppleの株価ティッカーで、基本的には現在の株価が平均値を上回っているか下回っているかを判断します。
クロールの段階で、GPT-3.5やGPT-4のモデルを使い、合成データからデータを生成し、Vaikunaの13bモデルを使って微調整を行います。
そして、それをサーバーにデプロイするわけです。
注目すべきことは、GPT-3.5とGPT-4の両方のモデルを使用して合成データを生成し、データ検索のさまざまなパラメーターや、コードの最適な生成コンテキストを提供するために、さまざまなモデルの開発に継続的に取り組んでいることです。
これは彼らのプロジェクトの始まりに過ぎないので、今後も継続的に取り組んでいくつもりです。
これはかなり新しいもので、4月初めごろ、4月19日に非常に短期間でリリースされました。明らかに、それが何をしようとしているのかについての投稿で、これは彼らが継続的に取り組んでいくものです。
このプロジェクトは、さまざまなソフトウェア開発者にとって、非常に実用的なものになりそうだからです。
さて、インストールに関してですが、インストールする前に1つだけ、ハードウェアの要件を確認しておいてください。
もちろん、Google Colabにインストールすることも可能ですが、同時に、これを実際に動かすには適切なGPUが必要です(非常に技術が必要なため)。
というのも、このコードはVast AIのインスタンスである1つのRTXでテストされており、RAMのピークは基本的に27GBです。
したがって、RAMが30GBを超えるGPUであれば、微調整の際に安全であることがわかります。
つまり、もしあなたが何も持っていないなら、30GB以下のRAMを持っているなら、試さないでください、ということです。
このアプリケーションを使うには、多くのRAMが必要になるからです。
だから、少し待って、いろいろなウェブサーバーに掲載されるのを待つことを強くお勧めします。
Git、Python、Visual Studio Codeがあれば、ローカルのデスクトップにインストールすることができます。
以前のビデオで、どのように動作するかの大まかなデモンストレーションをしているので、もしそれをチェックしたいのであれば、ぜひそうしてください。
LMの各ビデオでは、実際にどのように行うかの大まかなアウトラインを紹介しています。
さて、これからLMの計画について、彼らが何を目指しているのか、そのロードマップを紹介します。
次に進む前に、GitHubのこのリポジトリのコードファイルは、各フォルダーの説明のように、ある程度の理解を提供できることを付け加えておきたいと思います。ですので、これらのフォルダーが何であるか全くわからない場合は、ぜひ一読して、実際に何を意味するのかをより理解できるようになることをお勧めします。
そして、もしあなたがこれを使うのであれば、APIキーと、彼らが実際に持っているさまざまな要件を確認してください。
さて、実際のプロジェクトの可能性についてですが、このプロジェクトは、先に述べたように、多くのケースでかなり役に立つと思います。
しかし、まず、私が話したかったのは、AIの分野でチャレンジングだった問題、つまり、GPTにAPIドキュメントの読み解き方を教えるという問題に取り組もうとしている点です。
これは実際に解決すべき重要な問題です。このプロジェクトが実際のアプリケーションを巧みに革新することができれば、かなりの時間を削減することができるので、開発者が持つかもしれない進歩のような、さまざまな可能性を持っているのです。
このプロジェクトは、ソフトウェア開発者が多くの時間を節約し、さまざまなAPIやドキュメントを効率的に作成するのに役立つことでしょう。
次に、LLaMA Academyはオープンソースのプロジェクトであり、誰でもこのプロジェクトに貢献し、実際に改良を加えることができます。
だから、皆さんが正しいマインドセットと物事の仕組みを理解しているなら、興味があるなら、このプロジェクトに取り組んで、TwitterでDanielなどの人々と連絡を取り、実際にどのように努力を提供してこのプロジェクトを改善し、将来的にはもっと複雑な問題を解決できるようになるかをより理解できるようになることをお勧めします。
また、2つ目の特徴として、フラッシュアテンションをどのように実装していくのかが語られましたが、これらは、彼らが継続的に取り組んでいくことです。
ですから、皆さんもこのプロジェクトに注目することを強くお勧めします。
もちろん、これは建設中のプロジェクトなので、使い始める前にそのことを心に留めておいてください。なぜなら、これは継続的に革新していくプロジェクトだからです。
だから、ブレイクスルーになる可能性のあるものになるだろうから、これを監視しておいてくれ。
しかし、このビデオが有益で、何らかの価値を得ることができたなら、幸いです。
下の説明文にすべてのリンクを残しておくつもりです。
このような素晴らしいアプリケーションを作ったダニエルに、ぜひともエールを送ってください。
GitHubに「いいね!」と「スター」をつけてください。これは、彼らがさまざまな種類のアプリケーションを作るのをサポートするためのものですからね。
もし、まだ私の過去のビデオを見たことがないのなら、ぜひ見てください。
もし何かアップロードしてほしいものがあれば、ぜひ教えてください。それでは、ご覧いただきありがとうございました。
購読、通知ベル、いいね!、コメントをお願いします。
そして、みんな、素晴らしい一日を、笑顔で過ごしてください!また次のアップロードで会いましょう。
それでは、また。