arxiv: 2307.01163 (Chen+'23)
事前学習時 k 更新ごとに埋め込み層をリセット(active forgetting)することで収束が速くなり、低資源言語で XNLI, MLQA, XQuAD の精度が向上するそう
スクリーンショット_2023-07-04_18.02.45

この記事が気に入ったらサポートをしてみませんか?