ログイン
会員登録
マルチモーダルタスク
書いてみる
関連タグ
#ゼロショット学習 (61)
#ビジョン言語モデル (14)
#医療画像解析 (24)
人気
急上昇
新着
定番
有料のみ
2件
人気の記事一覧
An Integration of Pre-Trained Speech and Language Models for End-to-End Speech Recognition
Ikemen Mas Kot
9か月前
1
ViLaM: A Vision-Language Model with Enhanced Visual Grounding and Generalization Capability
Ikemen Mas Kot
1年前