s-miyawaki 2023年10月2日 12:43 arxiv.org/abs/2308.16890背景)会話スキル・視覚物語生成能力について精緻な LVLM 評価研究が少ない提案)LVLM 能力を総合評価すべく 27 サブタスクをカバーする視覚対話データ TouchStone を提案し LLM による評価を実施 いいなと思ったら応援しよう! チップで応援する #大規模言語モデル #LVLM #LLM評価