miya 2023年10月2日 12:24 arxiv.org/abs/2308.16463背景)既存 LVLM は複数画像間で一貫した対話を実現できない提案)複数画像を考慮する指示追従モデル SparklesChat、GPT-4 を用いた評価ベンチマーク SparklesEval を提案 #大規模言語モデル #InstructionTuning #LVLM この記事が気に入ったらサポートをしてみませんか? サポート