CVPR論文をリストアップしているGitHubリポジトリのメモ
CVPR 2024
awesome-cvpr-2024
カテゴリ分けをしてリストアップしているリポジトリ。
top-cvpr-2024-papers
物体検出関連のCVツール Supervision 開発者のリポジトリ。
物体検出やセグメンテーション関連に注目している印象。
(他ジャンルの論文もある)
リストアップされている本数は少ないが、24/06/12時点でおそらく更新中。
Awesome-CVPR2024-Low-Level-Vision
画像/動画の品質アップ系の論文を中心にリストアップしている印象のリポジトリ。
個人的に気になる論文
物体検出
YOLO-World: Real-Time Open-Vocabulary Object Detection Open Vocabularyで検出対象を指定できる手法。自動アノテーションで利用したいのでニッチな対象の検出能力が気になる。
セグメンテーション
Matching Anything by Segmenting Anything トラッキングラベル無しで任意の物体をトラッキングする手法。
Amodal Ground Truth and Completion in the Wild occlusionで見えない部分のマスクも予測する手法。手持ちのデータセットにocclusionのメタ情報をつける等、色々と利用できそう。ただの好奇心として、錯視画像に対する反応を見てみたい。
モーション
FaceTalk: Audio-Driven Motion Diffusion for Neural Parametric Head Models オーディオから顔の3Dモーションデータを生成する手法。AIキャラクターのリップシンクに役立ちそう。推論時間がどの程度か気になる。(リップシンク目的だとtext2motionの方が便利だろうか)
随時追加
この記事が気に入ったらサポートをしてみませんか?