arxiv.org/abs/2308.16890 背景)会話スキル・視覚物語生成能力について精緻な LVLM 評価研究が少ない 提案)LVLM 能力を総合評価すべく 27 サブタスクをカバーする視覚対話データ TouchStone を提案し LLM による評価を実施