Shinoda
Waalsforce 代表|AIエンジニア|SIer→生成AIエンジニアに転身、生成AI塾講師、FLOWGPTのプロンプトハッカソンで2位と傑出賞を獲得、JAWS-UG Nagoya Staff、AWS Community Builder、JAWSDAYS2022 実行委員
最近の記事
覚書:SELF-ROUTE:長文脈理解における RAG と LLM の最適統合 - 性能とコストのトレードオフを克服する新アプローチ
https://www.arxiv.org/pdf/2407.16833 この研究は、大規模言語モデル(LLM)における長文脈理解の二つの主要アプローチ、検索拡張生成(RAG)と長文脈LLM(LC)を包括的に比較し、両者の長所を活かす新しい手法SELF-ROUTEを提案しています。性能とコストのトレードオフを詳細に分析し、実用的な長文脈アプリケーション開発のための指針を提供しています。 背景と動機: a) RAG (検索拡張生成): 定義: 外部知識ベースから関連情報を