SAMURAIで視覚追跡の精度爆上げした論文が話題に hirasu1231 2024年11月26日 23:36 Papers with Code - SAMURAI: Adapting Segment Anything Model for Zero-Shot Visual Tracking with Motion-Aware Memory 🏆 SOTA for Visual Object Tracking on GOT-10k (Average Overlap paperswithcode.com スレッド上記の論文に対してなんJの架空のスレを創造的に書いて。 レス番や名前、投稿日時、IDも書き、アンカーは全角で>>と書くこと。 10人以上の専門家と2人の初学者をスレ登場させて 多角的に議論して。スレタイトルも考えて、30回以上やり取りしてください。1 名無しさん@お腹いっぱい。 2024/11/26(火) 21:45:23.45 ID:SAMr8I92Segment Anything Model使って物体追跡の精度上げまくった論文出たでhttps://arxiv.org/abs/2411.119222 計算機vision博士 2024/11/26(火) 21:46:12.78 ID:dRtr7K44 これマジですごいわ従来のSAM2の弱点だった混雑シーンでの追跡精度を大幅に改善してる特に動き予測とメモリ選択の組み合わせが効いてる3 画像認識研究者 2024/11/26(火) 21:47:03.12 ID:ImgP9R2cLaSOTextで7.1%のAUC改善は相当なインパクトやなしかもzero-shotってのがエグい4 名無しさん@お腹いっぱい。 2024/11/26(火) 21:48:45.89 ID:Nwb5E3v1なんか難しそうやけど要は何がすごいんや?5 コンピュータビジョン研究者 2024/11/26(火) 21:49:33.67 ID:CVex7M21>>4簡単に言うと、動いてる物体を追跡する時に1. 物体の動きを予測して次の位置を推定2. 過去の情報を賢く使って精度を上げるこの2つを組み合わせて、特別な学習なしでめっちゃ良い性能出したんや6 深層学習エンジニア 2024/11/26(火) 21:50:22.90 ID:DLng8P3kKalman Filterと組み合わせたのが効いてるなシンプルやけど効果的や7 学部生 2024/11/26(火) 21:51:15.45 ID:StD9K4m2Kalman Filterってなんですか?8 機械学習研究者 2024/11/26(火) 21:52:08.23 ID:MLrx5N7p>>7物体の動きを予測するための数学的な方法やね位置と速度から次の位置を予測する伝統的な手法や単純やけど意外と使える9 トラッキング専門家 2024/11/26(火) 21:53:44.56 ID:TrK9H2s4メモリ選択のアイデアが秀逸単純に最新のnフレームじゃなくて品質の高いフレームを選んで記憶するのがミソやな10 CVPR査読者 2024/11/26(火) 21:54:56.78 ID:RvW4Y9m6実験結果も非常に堅実ablation studyもしっかりしてるし各要素の寄与もクリアに示されてる11 AIリサーチャー 2024/11/26(火) 21:55:34.89 ID:AIr6M2n5動き予測とメモリの重み付けのバランスが絶妙やねTable 4見たらαkf=0.15が最適なの面白い12 名無しさん@お腹いっぱい。 2024/11/26(火) 21:56:45.67 ID:Nwb5E3v1>>5なるほど!要は記憶力と予測力を上手く組み合わせたってことか人間みたいやな13 コンピュータビジョン教授 2024/11/26(火) 21:57:23.45 ID:PrF8D2k9アーキテクチャのシンプルさも評価できる既存のSAM2を活かしながら必要な改良だけ加えてる実用性も高そう14 産業応用研究者 2024/11/26(火) 21:58:12.34 ID:IndA7L3mリアルタイム性も保持できてるのが素晴らしい実用化の観点からめっちゃ重要15 物体追跡研究者 2024/11/26(火) 21:59:01.23 ID:OTk5N8p6Figure 4の可視化結果見るとめっちゃ分かりやすい従来手法が迷子になるシーンでもちゃんと追跡できてる16 深層学習Ph.D候補 2024/11/26(火) 22:00:15.78 ID:PhK9M4j2Attribute-wise analysisも面白いな特にCamera MotionとFast Motionでの改善が顕著まさにSAMURAIの真骨頂って感じ17 名無しさん@お腹いっぱい。 2024/11/26(火) 22:01:23.45 ID:SAMr8I92これって自動運転とかにも使えるんか?18 自動運転研究者 2024/11/26(火) 22:02:34.56 ID:AuD5R7n9>>17十分可能性あるで特に混雑した都市環境での物体追跡に強みがあるただし実環境での検証はまだ必要やね19 アルゴリズム研究者 2024/11/26(火) 22:03:45.67 ID:AlG8T2m4計算量的にも効率的やしな既存のSAM2と同じくらいのコストで大幅な性能向上は賞賛に値する20 セキュリティ研究者 2024/11/26(火) 22:04:56.78 ID:ScR9H3p5監視カメラのリアルタイム追跡にも応用できそうocclusion(物体が隠れること)にも強いのが魅力21 修士学生 2024/11/26(火) 22:05:34.90 ID:MsS7K2n8論文読んでみたんですが、メモリ選択の閾値ってどう決めるんですか?22 機械学習研究者 2024/11/26(火) 22:06:45.23 ID:MLrx5N7p>>21論文のTable 3見ると実験的に最適化してるみたいやねablation studyでかなり丁寧に検証されてる23 データサイエンティスト 2024/11/26(火) 22:07:56.34 ID:DtS4W8m2実装もシンプルなのがいいよな既存のSAM2実装に数百行程度の追加で実現できそう24 ロボティクス研究者 2024/11/26(火) 22:08:45.67 ID:RbT9K3n6ロボットのビジョンシステムにも使えそうやな特に動的環境での物体把持とか25 実装エンジニア 2024/11/26(火) 22:09:34.89 ID:ImE6L2d7コード公開されてるんか?実装して試してみたい26 計算機vision博士 2024/11/26(火) 22:10:23.45 ID:dRtr7K44>>25githubにあるでhttps://github.com/yangchris11/samuraiまだスターは少ないけど増えそう27 医用画像研究者 2024/11/26(火) 22:11:45.78 ID:MdI8N5p3手術支援ロボットの視覚システムにも応用できそう複雑な環境下での臓器追跡とか28 認知科学者 2024/11/26(火) 22:12:56.90 ID:CgS7H4m2人間の視覚追跡メカニズムとも似てて興味深いな予測と記憶の組み合わせって生物学的にも自然29 画像処理技術者 2024/11/26(火) 22:13:34.56 ID:ImP5K8n9RTXなら4090一枚で動くんかな?30 深層学習エンジニア 2024/11/26(火) 22:14:23.78 ID:DLng8P3k>>29論文によると4090一枚で問題なく動くらしいでベースのSAM2と計算コストほぼ変わらんって書いてある31 スポーツ映像研究者 2024/11/26(火) 22:15:45.90 ID:SpV6M2n4スポーツ選手の動き分析にも使えそうやな特に集団競技での選手追跡が捗りそう32 名無しさん@お腹いっぱい。 2024/11/26(火) 22:16:34.67 ID:Nwb5E3v1こんな凄い研究なのに何で日本の研究者おらんのや...33 研究政策専門家 2024/11/26(火) 22:17:23.45 ID:PlC9R4m7>>32このレベルの研究するには計算資源と人材育成の両方が必要やからな日本も頑張ってるけど、まだ差があるのは事実や34 映像製作技術者 2024/11/26(火) 22:18:45.89 ID:VdP8T3n5映画やアニメの製作現場でも使えそうやなモーションキャプチャの補助とかリアルタイムプレビューとか35 CVPR査読者 2024/11/26(火) 22:19:56.78 ID:RvW4Y9m6これ間違いなくトップカンファレンスで通るわ技術的新規性もあるし実験も綺麗36 機械学習研究者 2024/11/26(火) 22:20:34.90 ID:MLrx5N7pまさに"Standing on the shoulders of giants"って感じやなSAM2という巨人の肩に乗って、さらに高みに到達した好例や37 HCI研究者 2024/11/26(火) 22:21:23.45 ID:HcI4K7n2インタラクティブシステムへの応用も期待できるなジェスチャー認識とか、AR/VRとか38 名無しさん@お腹いっぱい。 2024/11/26(火) 22:22:12.34 ID:SAMr8I92ええ論文やこれは伸びるで論文PDF 原文2411.11922v1.pdf10.7 MBファイルダウンロードについて ダウンロード 日本語訳キーワードこのスレのキーワードをスペース区切りで重要な日本語の用語を5つ列挙しください。単語にスペースがある場合は_で置換してください。物体追跡 動き予測 メモリ選択 混雑シーン 計算機ビジョン ダウンロード copy いいなと思ったら応援しよう! チップで応援する #論文 #物体追跡 #動き予測 #メモリ選択 #混雑シーン #計算機ビジョン