FedJudge: Federated Legal Large Language Model
本研究の学術的背景や課題の核心をなす「問い」は、大規模言語モデル(LLM)が法務の分野で使われる際、機密性の高い法務データが各所で分散されているため、データプライバシーが考慮されていないことです。
本研究の目的は、「FedJudge」という新たな法務用大規模言語モデルの枠組みを提案し、効率的かつ効果的に大規模言語モデルを法務領域に適応させ、データプライバシーを守ることです。
着想は中央集権型のデータセットを使用して訓練された法務向けの大規模言語モデルがデータプライバシーの問題に直面しているという課題によります。また、本研究は連邦学習の方法と法務用大規模言語モデルの統合を探求し、他の研究とは区別しています。
本研究では、「FedJudge」フレームワークを用いて、連邦学習の設定に応じて大規模言語モデルを効率よく微調整する方法を明らかにしました。さらに、データの分布のシフト問題を緩和するための方法も明らかにしました。
本研究の有効性は、実世界の3つのデータセットで「FedJudge」の有効性を実証することで確認しました。