ログイン
会員登録
ビデオ理解
書いてみる
関連タグ
#タスク (7,640)
#モデル (14,621)
#ビデオ (1,686)
#テキスト (4,504)
#パフォーマンス (9,772)
#2023 (8,358)
人気
急上昇
新着
定番
有料のみ
7件
人気の記事一覧
MMWorld: Towards Multi-discipline Multi-faceted World Model Evaluation in Videos
Ikemen Mas Kot
5か月前
MLVU: A Comprehensive Benchmark for Multi-Task Long Video Understanding
Ikemen Mas Kot
5か月前
C3LLM: Conditional Multimodal Content Generation Using Large Language Models
Ikemen Mas Kot
5か月前
TOPA: Extend Large Language Models for Video Understanding via Text-Only Pre-Alignment
Ikemen Mas Kot
5か月前
Agent AI: Surveying the Horizons of Multimodal Interaction
Ikemen Mas Kot
6か月前
Video Annotator: A framework for efficiently building video classifiers using vision-language models and active learning
Ikemen Mas Kot
9か月前
FunnyNet-W: Multimodal Learning of Funny Moments in Videos in the Wild
Ikemen Mas Kot
10か月前