NESTLE: a No-Code Tool for Statistical Analysis of Legal Corpus

2023年9月14日 21:49

1. 本研究の学術的背景は、大規模な法制文書の統計分析が重要な法的洞察をもたらすという認識です。一方、その分析には(1)文書検索ツールを用いてコーパスの一部を選択し、(2)情報抽出（IE）システムによりテキストを構造化し、(3)統計分析のためにデータを視覚化するといった工程が必要となります。しかし、それぞれの工程では特殊なツールやプログラミングの技術が求められる一方で、これまで一体化された「ノーコード」ツールは存在していませんでした。特に、目標となる情報がIEシステムのオントロジーに事前定義されていない場合、個々のシステムを構築する必要があります。

2. 本研究の目的は大規模な法制文書の統計分析のためのノーコードツール「NESTLE」を提供することです。NESTLEの独自性および創造性は、ユーザが目標の文書を検索し、情報を抽出し、構造化されたデータを視覚化する全工程を、補助的にGUIを利用することで、チャットインターフェースを通じて行えることです。

3. この研究は、法制文書の大規模な統計分析による法的洞察が増えつつあり、そのための手段としてのツールが必要とされていたことから着想を得ています。この研究は、情報抽出、大規模言語モデル、法的テキスト分析といった複数の研究分野に貢献しています。

4. 本研究では、検索エンジン、エンドツーエンドの情報抽出システム、そして全体を連結しチャットインターフェースを提供する大規模言語モデルという三つの主要なコンポーネントで構成されるNESTLEを提供しました。このツールの提案により、IEシステムで事前定義されていない任意の情報を抽出することが可能になりました。

5. 本研究では15の韓国の先例IEタスクとLEXGLUEからの3つの法的テキスト分類タスクを用いてシステムの有効性を検証しました。詳細な解析は、システムを構築する際の精度、時間、コストのトレードオフについての洞察を提供します。

NESTLE: a No-Code Tool for Statistical Analysis of Legal Corpus

いいなと思ったら応援しよう！