論文概要

書いてみる

人気の記事一覧

arxiv.org/abs/2310.11441 SAM によるセグメント結果を GPT-4V に入力する Set-of-Mark (SoM) を提案。SoM により視覚グラウンディングにおける RefCOCOg で優れた性能を示した。

1年前