Week of 5/27(2024) LangChain Release Notes
LangChain v0.2 にはバージョン管理されたドキュメントがあり、LangSmith には既成の評価プロンプト、データセットの分割と繰り返しが追加されています。また、NVIDIA コンテストと NYC/SF ミートアップもチェックしてください。
ドキュメントが更新され、データセットが分割され、ミートアップのスポットが埋まりつつあり…LangChain は進化を続けています 🐎。今回のエディションでは、バージョン管理されたドキュメント、データセットの改善、LangSmith の新しい既製評価ツールをご覧ください。
また、「Speak the Lang」やパートナー活動(NVIDIA との新しいコンテストを含む)では、実際の使用例も紹介しています。最後に、コミュニティ メンバーが、LangChain 初心者でも AI の達人でも参照できる教育資料(ビデオ、ブログ、GitHub プロジェクト)を紹介します。ぜひお読みください。
製品アップデート
💡
LangChain、LangSmith、LangGraph の最新の製品アップデートとニュースを紹介します
ランチェーン
📝 LangChain v0.2 リリースにはバージョン管理されたドキュメントがあり、構造とコンテンツがより明確になっています。
LangChain v0.2 のドキュメントを更新し、次のように分割しました。
チュートリアル: 特定のアプリケーション (チャットボット、RAG アプリ、エージェントなど) を最初から最後まで構築する方法に関するステップバイステップのガイド
ハウツーガイド: 特定のタスクを実行する方法に関する詳細な手順ガイド (より詳細、高度)
概念ガイド: 新しい概念や LangChain の知識に関する用語集とテクニック
API ドキュメント: 詳細な技術リファレンス ドキュメント
PythonとJavaScriptの新しいドキュメントを確認して、ここでフィードバックをお寄せください。既存のコードベースを移行するには、 Python 移行スクリプトまたはJavaScript/TypeScript 移行スクリプトに従ってください。
📞 JavaScript のマルチモーダル関数呼び出しにより、画像、ビデオ、オーディオを渡して構造化された出力を取得できます。
@langchain/google-genaiまたはパッケージに@langchain/google-vertexai、構造化された出力による関数呼び出しを追加しました。これにより、画像、音声、ビデオなどのマルチモーダル サポートを備えた、より信頼性の高いアプリケーションを構築できます。詳細については、ドキュメントをご覧ください。
LangSmith
✂️ データセットの例の評価とフィルタリング/編集のためのデータセットの分割
データセットの分割を使用すると、LangSmith でデータのサブセットに対して評価を実行するのが簡単になります。異なる分割名で例にタグを付けたり、分割を編集および追加したり、必要な基準でフィルタリングしたりできます。
分割は、複数のカテゴリを含むデータセットを個別に評価する場合に便利です。これにより、評価ワークフローを維持しながら、テストする別の分割に例を追加することで、新しいユースケースをテストできます。
分割に加えて、データセットの例に対して次のアクションを実行すると、関連情報をすばやく見つけることができます。
サンプルを別のデータセットに複製する
https://blog.langchain.dev/content/images/2024/05/dataset-improvements---compressed.gif
このビデオでは、データセットの分割の使用方法の例を説明します。
🔁 実験結果への信頼を築くための繰り返し
LangSmith で実験を複数回繰り返して実行できるようになりました。これにより、アプリケーションや LLM を審査員として評価することによって生じる変動によるノイズが平滑化され、実験結果に対する信頼性が高まります。
このビデオでは、繰り返しのあるデータセットを評価する方法を学びます。N 回の繰り返しで平均スコアを確認したり、繰り返し間の出力の変動を比較したりすることもできます。
https://blog.langchain.dev/content/images/size/w1000/2024/05/repetitions.gif
🔧 RAG の不良検索や幻覚をキャッチするための既製のオンライン評価プロンプト
LangSmith のオンライン評価ツール (LLM-as-judge) は、カスタマイズ可能なプロンプトと自動化ルールを使用して、実稼働トレース上で自動的に実行されます。当社の新しい既製の評価ツールは、次の機能を備えたカスタム プロンプトを提供します。
取得したドキュメントがユーザー入力の質問に関連しているかどうかをフラグ付けします (ドキュメントの関連性)
RAG 反応で幻覚の有無を確認する (幻覚)
RAG 回答が質問への回答に役立つかどうかを確認します。グラウンド トゥルース回答は必要ありません (回答の有用性)
毒性などの特定の基準に基づいてフラグを立てる(タグ付け)
ボーナス:このビデオを視聴するか、ドキュメントをチェックして、LangSmith を使用して PII または有害なクエリを含むユーザー入力を検出するガードレールを確立する方法を確認してください。
💬 ハンドルなしでプライベートプロンプトを管理する
プロンプトのナビゲーションをより簡単にするために、SDK と LangSmith プロンプト UI を改良しました。現在、作成時にハンドルが必要なのはパブリック プロンプトのみです。新しいアカウントは、パブリック プロンプトが作成されるまで LangChain Hub ハンドルを作成する必要はありません。
SDK 経由で独自のプロンプトをプルまたはプッシュする場合、ハンドルを指定する必要がなくなりました。たとえば、hub.pull('prompt_name')の代わりにを使用できますhub.pull('handle/prompt_name')。
今後のイベント
🎫
来月開催される IRL イベントで、LangChain の愛好家、従業員、熱心な AI アプリ開発者と会いましょう。
🐻 6 月 18 日 (サンフランシスコ): バークレー LLM ミートアップ。バークレーの博士課程の学生、教員、卒業生の皆さん、お集まりください。LangGraph や、カリフォルニア大学バークレー校で構築されたクールな OSS プロジェクトについて学び、LLM で働く志を同じくする仲間と交流しましょう。こちらからサインアップしてください。
🏙️ 6 月 26 日 (ニューヨーク): LangChain と Elastic NYC のミートアップ。ライトニング トークを聞き、LangChain チームのメンバーと会い、ネットワーキング、ピザ、軽食をお楽しみください。こちらからお申し込みください。
言語を話す
🦜
LangChain、LangSmith、LangGraph を使って、本番環境でも高品質かつ正確な LLM アプリを構築した実際の使用例と事例
エージェントの自動修正
反省ループは、LLM に過去の行動を振り返り、批評するよう促し、エージェントの質と成功率を向上させることができます。エージェントが自己修正を活用してより良い結果を出す方法は次のとおりです。
🌀 LangGraph と Codestral による自己修正コードアシスタント
Mistral の Codestral-22B (80 以上のプログラミング言語でトレーニングされたコード生成モデル) のリリースに伴い、Codestral と LangGraph を使用して自己修正コード アシスタントを構築するテストを行いました。
このビデオでは、AlphaCodium の論文から借用したアイデアを使用して、構造化された出力/ツールの使用、ループ内のユニット テスト、およびエラーを自己修正するためのエラー フィードバックを備えた Codestral の使用方法を示します。また、こちらのクックブックで手順を確認することもできます。
🌐 テキストから SQL へのレビュアー自動修正機能を備えたマルチエージェント フローエージェント
FlowiseAI の新しいマルチエージェントフローは、タスクで協力するエージェントのチームを特徴としています。テキストから SQL へのクエリの場合、処理は次のようになります。SQL エキスパートエージェントがクエリを生成し、エグゼキュータエージェントがそれを実行し、最後にレビューアエージェントがそれを自動修正します。
このシステムは、関数呼び出し、マルチモーダル性、API、プロンプト入力変数とともに、リフレクティブ ループを使用して、長時間実行されるタスクからの出力品質を向上させます。
エージェントによる財務分析
投資から経費の追跡まで、従来の財務分析の分野を再構築することは、エージェントによって可能になります。以下にいくつかの優れた例を示します。
📈 GPT4 を搭載した AI エージェントは、十分なパフォーマンス アトリビューション アナリストになれるでしょうか?
New York Life Investments の Bruno Veras De Melo 氏は論文の中で、LangChain エージェントを使用して投資ポートフォリオの成功の要因をより適切に評価する方法を説明しています。
LangChain を標準エージェント フレームワークとして使用し、Chain-of-Thought (CoT) や Plan of Solve (PS) などの迅速なエンジニアリング手法を使用することで、パフォーマンス ドライバーの分析で 93% の精度を達成し、公式試験基準をシミュレートする QA 演習で 84% の精度を達成しています。
💸 LangGraph 経費トラッカー
Jan Willem Altink (Esdec のプロダクト マネージャー) によるこのプロジェクトは、LangGraph を使用して経費を管理する方法を示しています。請求書の写真を (抽出によって) 送信すると、プロジェクトによって経費を構造化して分類し、データベースに格納できます。
コラボレーションと統合
🤝
私たちは 、統合を利用してユーザーがエコシステム内のパートナー機能を活用できるよう支援しています。
NVIDIA と LangChain による生成 AI エージェント開発者コンテスト
NVIDIA の LLM スタックと LangChain または LangGraph フレームワークの 1 つ以上を使用して、テキストベースまたはマルチモーダル エージェントを作成します。次に、90 秒未満のビデオをソーシャル メディアで共有し、エントリー フォームを送信します。今すぐ 6 月 17 日までコンテストに参加してください。GPUの賞品がかかっています!
Azure コンテナー アプリの動的セッションを使用したコード インタープリター
Dynamic Sessions との新しい LangChain 統合により、エージェントに Python コードを実行する機能を安全かつ確実に提供できます。LangGraphと動的セッションを使用してデータ アナリストを構築する方法については、ブログ投稿を読むか、チュートリアルをご覧ください。
クロード3による強制ツールコール
Anthropic からの強制ツール呼び出しにより、LangChain の bind_tools および with_structured_output 機能の信頼性の高いツール呼び出しが可能になります。パッケージをアップグレードして、PythonまたはJavaScript でlangchain-anthropicこれらの改善点を試してください。
Nomic Embed の Python ローカルサポート
LangChain ユーザーは、公式にサポートされている Nomic Embed のローカル バージョンにアクセスできます。入力のサイズと複雑さに基づいて、ローカル推論とリモート推論を動的に切り替えます。パフォーマンスとコストを最適化しながらテキストを埋め込む方法の詳細については、こちらをご覧ください。
☁️ 🦸 そして先週の Google Cloud Summit でLangGraph を推進してくれたEden Marco に心から感謝します。
コミュニティから
🗣️
100 万人を超える開発者とビルダーが日常的に LangChain をどのように使用しているかをご覧ください。より良いものを作るためにいつもご協力いただきありがとうございます。
LangChain を使い始めようと思っているけれど、どこから始めればいいのか分からないですか? 私たちのコミュニティのメンバーがあなたをサポートします。😊
以下の 14 分間のビデオでは、David ( Decoder.shの創設者) が、テンプレート、モデル、実行可能ファイルを使用して、基礎から始めて最初のチェーンを構築する方法を説明しています。
動画といえば…Santiago Valdarrama (Tideily の共同設立者) による、RAG アプリをゼロから構築する方法に関する以下のチュートリアルをご覧ください。RAG アプリは LangChain、Pinecone、OpenAI を使用して構築されており、YouTube 動画について質問することができます。
RAG の旅では、質問しながらコンテンツを保持するためにドキュメントを分割/チャンク化する必要がある場合があります。Sudarshan Korala の (データ サイエンスの基礎)チュートリアルを参照してください。
より高度な RAG コンセプトを探求している場合は、次の点に興味があるかもしれません。
LangGraph を使用して、適応型 RAG、修正型 RAG、自己 RAG を組み合わせて、取得したドキュメントの関連性と精度を向上させる - Ankush Singal (データ サイエンス マネージャー @ Confidential)
LangChain と Qdrant フィルターを使用して検索結果を絞り込むための自己クエリ検索- Daniel Romero (Qdrant の開発者アドボケート)
GraphRAG を LangChain と Neo4j とともに導入し、純粋なベクトル DB の代わりにグラフを使用して RAG アプリケーションを強化し、検索機能を向上させます - Valentina Alto (Microsoft の Azure スペシャリスト)
さらにコンテンツをお探しの場合は、さらに多くのリソースをご用意しています。
その他のビデオ:
LangGraph Llama 3 と Groq を使用した AI エージェントの作成(Sam Witteveen (Red Dragon AI 共同設立者))
Amazon Bedrock を使い始めて、LangChain と Chainlit でシンプルな ChatUI を作成する(Sudarshan Koirala (KONE の ML エンジニア))
LLM と AI ベンチマーク - Adam Lucek (シスコのデジタル スペシャリスト) によるGenAI Eval の詳細
Eduardo Vasquez (Complidata のデータ サイエンティスト) による自己反省を伴う高度な RAG
その他のブログ:
Yohan Lasorsa と Glaucia Lemos (Microsoft の開発者アドボケート) による、LangChain.js を使用した RAG とのサーバーレス AI チャット
そして、GitHub プロジェクト:
Cognita: モジュール式 RAG アプリケーションを構築するためのオープンソース RAG フレームワーク(Tahreem Rasul (Red Buffer の ML エンジニア) による)
HippoRAG: 人間の長期記憶の神経生物学にヒントを得た RAG フレームワーク(Bernal Gutierrez と Yiheng Shu (オハイオ州立大学の博士課程学生))
Ishan Anand (ML コンサルティング) による、Mistral AI、Neon、LangChain を使用したテキストから SQL への変換システムの構築
Assaf Elovic (Wix の R&D 責任者) によるLangChain ドキュメント ローダーを使用したローカル ファイルによる GPT 研究者のサポート
Lang の最新情報をすべて把握するにはどうすればよいでしょうか? LangChain のブログとYouTube チャンネルをチェックして、さらに多くの製品とコンテンツのアップデートをご覧ください。