Large language models converge toward human-like concept organization
1. この研究の学術的背景とは大規模言語モデル(LLM)の性能です。LLMは知識の抽出、推論、対話において人間のような性能を発揮しますが、この性能が主に記憶とパターンマッチングによるものなのか、それとも人間のような推論的セマンティクスと世界知識を反映しているのかについては意見が分かれています。
2. 本研究の目的は、大規模な言語モデルが概念をどのように組織化するか、またそれが知識ベースでの概念の組織化とどの程度似ているのかを示すことです。研究の独自性と創造性は、大規模言語モデルが生のテキストからどの程度集合的な、制度的な知識を学べるのかを明らかにした点にあります。
3. 本研究の着想は、知識ベース(例えば、WikiData)が大規模で高品質な推論的セマンティクスと世界知識の表象を提供する一方で、それらがどの程度大規模言語モデルで学習、反映されるか質問することからきています。
4. この研究では、大言語モデルが知識ベースと驚くほど似た方法で概念を組織化することを示しました。また、より大きく、より良質なモデルは、4つの言語モデル家族と3つの知識グラフ埋め込み全体でより人間らしい概念の組織化を示すことも確認しました。
5. 本研究の有効性は、大規模言語モデルの精度を、人間のように概念を組織化する能力との相関と比較することで検証しました。