ログイン
会員登録
AgentBench
書いてみる
関連タグ
#AgentBoard (1)
#BBH (5)
#Claude (4,969)
#CodeLlama (23)
#Dolly (17)
#Falcon (72)
人気
急上昇
新着
定番
有料のみ
2件
人気の記事一覧
Observational Scaling Laws and the Predictability of Language Model Performance
Ikemen Mas Kot
8か月前
AgentBench: Evaluating LLMs as Agents
Ikemen Mas Kot
1年前