Week of 4/29(2024) LangChain Release Notes
🦜🛠️ラングスミスの新機能
回帰テスト エクスペリエンスの向上: LLM アプリケーションに変更を加える場合は、以前のテスト ケースと比較して動作が回帰したかどうかを理解することが重要です。プロンプト、取得戦略、またはモデルの選択を変更すると、アプリケーションによって生成される応答に大きな影響を与える可能性があります。複数の実験にわたるデータを簡単に探索できるように、比較ビューを更新しました。
表示したい情報の粒度をカスタマイズできるように、さらに多くの表示オプションをリリースしました。重要な列、データポイント、グラフを表示します。
ベースラインと比較して評価メトリックが増加または減少したテスト実行を自動的に強調表示し、逸脱したテストのみを表示するようにフィルターします。
改善されたサイド パネル ビューにより、興味のある特定の実行の詳細を詳しく調べることができます。
詳細については、ビデオウォークスルーとブログをご覧ください。
注釈キューのホットキー:より迅速にナビゲートできるように、注釈キューにホットキーを導入しました !キーボード ショートカットがサポートされるようになったボタンの横にあるホットキー インジケーターを探してください。
Mustache のサポート:プレイグラウンドとプロンプト ハブのプロンプトのテンプレート言語を f-string と Mustache の間で切り替えるオプションが追加されました。これにより、変数の管理とフォーマットの方法がより柔軟になります。
評価:新しいビデオ シリーズでは、LangSmith Experiments がテスト カバレッジの追加、回帰の特定、レイテンシー、コスト、品質の間で情報に基づいたトレードオフを行うのにどのように役立つかを示します。 RAG 評価に焦点を当てたさらに 3 つの概念をリリースし、応答品質を評価する方法を示しました。正確性( Video 、 Docs )、幻覚( Video 、 Docs )、および取得された文書の関連性( Video 、 Docs ) です。
Azure Marketplace: LangSmith がAzure Marketplaceで利用可能になったことを発表できることを嬉しく思います。 Azure クレジットを使用して Azure Marketplace を通じて LangSmith を購入すると、データが Azure VPC に完全に含まれた状態に保たれ、デプロイが容易になり、よりスムーズな調達プロセスを体験できます。当社のブログで詳細を確認し、 営業担当者に問い合わせて、当社の専門家との会話を開始してください。
🕸️ ランググラフ
LLM を使用してステートフルなマルチアクター アプリケーションを構築するためのフレームワークであるLangGraphを使用した 3 つの新しいチュートリアルを確認してください。
来週の水曜日、5 月 8 日に AI Makerspace とオンライン ワークショップを開催します。そこでは、LangGraph を使用してマルチエージェント RAG アプリケーションを構築およびオーケストレーションする方法を説明します。 ここからサインアップしてください!
LangGraph と Llama3 を使用した信頼性の高いローカル RAG エージェント:このビデオでは、LangGraph と Llama3-8b を使用して独自のローカル RAG エージェントを最初から構築する方法について詳しく説明します。 3 つの高度な RAG 論文のテクニックを LangGraph を使用した単一の制御フローに組み合わせて、エージェントのパフォーマンスを向上させる方法を示します。 コード。
LangGraph および Mistral を使用した高度な RAG エージェント: LangGraph および Mixtral 8x22B の制御フローを使用して高度な RAG エージェントを構築する方法を示すビデオと一連のクックブックをリリースしました。
LangGraph を使用してコンピューティング オリンピック エージェントを構築する:プリンストン大学の研究者は最近、USA コンピューティング オリンピック コンテストのベンチマーク データセットを公開し、ゼロショット GPT-4 エージェントが課題の 8.7% のみを解決できることを明らかにしました。 LLM は最も困難な問題を単独で解決することはできませんが、賢いフロー エンジニアリングを使用すれば、人間と AI のハイブリッド システムを構築して、優れたソリューションに到達することができます。私たちは彼らの論文を実装し、LangGraph を使用してプログラミング オリンピアンを構築する方法を示すビデオをリリースしました。 コード。
👀 見逃した場合に備えて
Dosu が LangSmith を使用して、即時エンジニアリングなしで 30% の精度向上を達成した方法:即時エンジニアリングは、LLM の学習を支援する最も一般的なアプローチですが、コンテキスト内 (少数のショット) 学習により、大幅に優れた結果が得られます。問題と PR に自動ラベル付けする GitHub ボットである Dosu が、LangSmith を使用してコンテキスト内学習パイプラインを強化する方法をご覧ください。 ビデオ、 ブログ、 クックブックをご覧ください。
エージェントのベンチマーク:さまざまなモデルを搭載したエージェントを評価するベンチマーク結果を更新しました。これらのベンチマークは、 LangSmithと LangChain の標準ツール呼び出しインターフェイスを利用しているため、特定のタスクにどの LLM が最適であるかを確認できます。私たちの方法論の詳細については、元のブログ投稿をご覧ください。
CodiumAI を使用したフロー エンジニアリング:フロー エンジニアリングは、反復プロセスを使用した単純なプロンプト エンジニアリングを上回るパフォーマンスを発揮する能力があるため、人気が高まっています。 LangGraph は、エージェントをグラフとして作成するための高度に制御可能なフレームワークであり、フロー エンジニアリングの原則と密接に連携しています。このウェビナーのリプレイでは、当社 CEO の Harrison Chase と CodiumAI CEO の Itamar Friedman の話を聞きます。
LangChain と Neo4j を使用したグラフベースのメタデータ技術によるベクトル取得の最適化:テキストの埋め込みはドキュメントの関連性を特定するのに役立ちますが、日付やカテゴリなどの特定の基準に苦労します。メタデータ フィルタリングとベクトル類似性検索を組み合わせることで、特定の属性とよりよく一致するように検索結果を絞り込むことができます。このアプローチについては、 ブログで詳しく説明しており、LangChain と Neo4j を使用してより正確なドキュメントを取得する方法を示しています。
🤝 コミュニティから
Microsoft の Yohan Lasorsa 氏によるLangChain.js を使用して、RAG でサーバーレス AI チャットボットを構築します。
ドキュメントのチャンク化はどのように行われますか?データ サイエンスの基礎によるLangChain を使用した分割の基礎。
CopilotKit の Bonnie がAI を活用したブログ プラットフォーム (Langchain、Next.js、CopilotKit) を構築します。
LangChain とフルスタック AI による Streamlit を使用して ChatGPT ウェブサイトを構築する方法を学びます。
Eden Marco によるLangChain ツール呼び出しの説明。
Perplexica - Kns と Swifty によって LangChain を使用して構築された AI を活用した検索エンジン。
ScrapeGraphAI による LangChain をベースにした Web スクレイピング Python ライブラリ。
https://blog.langchain.dev/week-of-4-29-langchain-release-notes/