ログイン
会員登録
AQABench
書いてみる
関連タグ
#アルゴリズム (4,016)
#大規模言語モデル (2,901)
#推論能力 (51)
#連続的 (27)
#連続的推論能力 (1)
人気
急上昇
新着
すべての記事
有料の記事
1件
人気の記事一覧
AQA-Bench: An Interactive Benchmark for Evaluating LLMs' Sequential Reasoning Ability
Ikemen Mas Kot
1年前