「#LVLM」の人気タグ記事一覧｜note ――つくる、つながる、とどける。

動画をRAGで検索する時代が来る？「VideoRAG」の可能性

マスクAI～1人で10名分の働きを実現～

1か月前

2

PhD: A Prompted Visual Hallucination Evaluation Dataset

11か月前

1

最新AI論文楽しみ、ブックミーツ4冊。

みうぱ。"∞"

3か月前

【論文要約:自動運転関連】Can LVLMs Obtain a Driver’s License? A Benchmark Towards Reliable AGI for Autonomous Driving

5か月前

OmniMedVQA: A New Large-Scale Comprehensive Evaluation Benchmark for Medical LVLM

1年前

arxiv.org/abs/2308.16890 背景）会話スキル・視覚物語生成能力について精緻な LVLM 評価研究が少ない提案）LVLM 能力を総合評価すべく 27 サブタスクをカバーする視覚対話データ TouchStone を提案し LLM による評価を実施

1年前

arxiv.org/abs/2308.16463 背景）既存 LVLM は複数画像間で一貫した対話を実現できない提案）複数画像を考慮する指示追従モデル SparklesChat、GPT-4 を用いた評価ベンチマーク SparklesEval を提案

1年前