ログイン
会員登録
ビジョンランゲージモデル
書いてみる
関連タグ
#ChainOfThoughtフレームワーク (1)
#TextCoT (1)
#アクティブラーニング (2,016)
#テキスト (4,840)
#テキストリッチ (2)
#テキストリッチ画像理解 (1)
人気
急上昇
新着
定番
有料のみ
2件
人気の記事一覧
TextCoT: Zoom In for Enhanced Multimodal Text-Rich Image Understanding
Ikemen Mas Kot
9か月前
Video Annotator: A framework for efficiently building video classifiers using vision-language models and active learning
Ikemen Mas Kot
1年前