【論文】SuperGlue爆誕!画像マッチング界の革命キターーー!!!
スレッド
上記の論文に対してなんJの架空のスレを創造的に書いて。 レス番や名前、投稿日時、IDも書き、アンカーは全角で>>と書くこと。 10人以上の専門家と2人の初学者をスレ登場させて 多角的に議論して。初学者もいるので、例え話も混ぜて欲しい。スレタイトルも考えて、30回以上やり取りしてください。
1 風吹けば名無し 2024/11/23(土) 12:34:56.78 ID:supe1234
これマジ革命的やろ
特徴点マッチングの精度めっちゃ上がってるやん
2 風吹けば名無し 2024/11/23(土) 12:35:12.45 ID:glue5678
RANSACよりええ結果出してて草
時代は変わったんやな
3 画像処理の達人 2024/11/23(土) 12:35:45.12 ID:comp9876
アテンションと最適輸送問題を組み合わせるのが斬新やな
従来手法の限界を突破してる
4 機械学習初心者 2024/11/23(土) 12:36:23.67 ID:ml_n00b1
すまん、ワイには難しすぎて理解できへん
誰か分かりやすく説明してクレメンス
5 コンピュータビジョンの賢者 2024/11/23(土) 12:37:01.23 ID:cv_sage1
>>4
野球の例で説明したろか
従来法は、選手を見て「この二人似てるな」って単純にペア組んでたんや
でもSuperGlueは、チーム全体の戦略見ながら「この選手とこの選手組ませたら最強やな」って考えるみたいな感じや
6 機械学習初心者 2024/11/23(土) 12:37:45.89 ID:ml_n00b1
>>5
なるほど!そういう考え方なんか!
でもなんで急にこんな良い成績出せたんや?
7 深層学習研究者 2024/11/23(土) 12:38:23.45 ID:deep9999
アテンション機構がめっちゃ効いてるんや
特徴点同士が情報交換して「お前はどこと組むべきか」って学習できる
8 RANSAC信者 2024/11/23(土) 12:39:01.78 ID:rans8888
でもRANSACって20年以上使われてきた実績あるからな
本当にこれで置き換えられるんか?
9 SfMの専門家 2024/11/23(土) 12:39:45.34 ID:sfm7777
>>8
むしろRANSACいらんくらいの精度出とるで
DLTでも十分な結果出てるの見てみ
10 画像認識博士 2024/11/23(土) 12:40:23.56 ID:phd6666
実行時間が気になるな
69msって書いてあるけど、実用的な速度やな
11 ビジョン歴15年 2024/11/23(土) 12:41:01.23 ID:vis1515
SLAMへの応用も期待できるな
特徴点マッチングの精度上がれば軌道推定も改善されるやろ
12 深層学習研究者 2024/11/23(土) 12:41:45.67 ID:deep9999
>>11
せやな。しかもend-to-endで学習できるのがでかい
SuperPointと組み合わせたらもっと化けるで
13 初心者大学生 2024/11/23(土) 12:42:12.34 ID:stud5555
なんか難しそうやけど、要は写真の中の同じ場所見つけるのが上手くなったってことか?
14 コンピュータビジョンの賢者 2024/11/23(土) 12:42:56.78 ID:cv_sage1
>>13
そうそう!例えば友達100人おるパーティー写真があって、
別アングルから撮った写真の中から同じ人見つけるみたいな感じや
今までは顔だけ見て探してたけど、この手法は服装とか周りにおる人とかも考慮して探すんや
15 自己位置推定の達人 2024/11/23(土) 12:43:34.56 ID:loc8888
indoor/outdoorどっちでも強いのがエモいわ
従来手法やと環境変わるとガタ落ちやったのに
16 特徴点おじさん 2024/11/23(土) 12:44:12.89 ID:feat7777
SIFTの時代からずっとこの分野研究してきたけど、
こういう革新が来るの待ってたで
17 深層学習研究者 2024/11/23(土) 12:44:56.23 ID:deep9999
グラフニューラルネットワークの使い方も上手いわ
自己アテンションと相互アテンションの組み合わせが秀逸や
18 機械学習初心者 2024/11/23(土) 12:45:23.45 ID:ml_n00b1
>>14
なるほど!そう考えると確かに周りの情報も使った方が正確になりそうやな
ワイでも分かったで!
19 RANSACマスター 2024/11/23(土) 12:46:01.78 ID:rans9999
>>9
確かにその通りや
ワイもRANSAC使いやけど、これはガチで凄いわ
20 3次元復元研究者 2024/11/23(土) 12:46:45.34 ID:3d_8888
アブレーション実験もしっかりしてるのがいいよな
各コンポーネントの貢献度がよく分かる
21 画像処理の達人 2024/11/23(土) 12:47:23.56 ID:comp9876
重要なのはSinkhorn algorithmの使い方やな
パーティアルマッチングをうまく扱えてる
22 SLAM研究者 2024/11/23(土) 12:48:01.23 ID:slam6666
これ、リアルタイムSLAMにも使えそうやな
15FPSならイケるで
23 特徴点おじさん 2024/11/23(土) 12:48:45.67 ID:feat7777
>>22
せやけど、まだメモリ使用量が気になるわ
組み込み機器での実装はちょっと厳しそう
24 深層学習研究者 2024/11/23(土) 12:49:12.34 ID:deep9999
モデルの軽量化は今後の課題やな
でも精度と速度のトレードオフを考えるとこれでも十分やと思う
25 初心者大学生 2024/11/23(土) 12:49:56.78 ID:stud5555
これって将来スマホのカメラとかにも使えるんか?
26 コンピュータビジョンの賢者 2024/11/23(土) 12:50:34.56 ID:cv_sage1
>>25
今のままやとちょっと重いけど、軽量版作ればワンチャンあるで
例えばパノラマ写真撮る時の画像つなぎ合わせとかに使えそう
27 自己位置推定の達人 2024/11/23(土) 12:51:12.89 ID:loc8888
ARとかにも応用効くやろなぁ
位置合わせの精度上がりそう
28 幾何学の権威 2024/11/23(土) 12:51:56.23 ID:geom5555
Figure 7のアテンションパターンの可視化ええな
どういう特徴に注目してるか分かりやすい
29 機械学習初心者 2024/11/23(土) 12:52:23.45 ID:ml_n00b1
>>28
あの図の見方がよく分からんのやが...
30 幾何学の権威 2024/11/23(土) 12:53:01.78 ID:geom5555
>>29
お好み焼き屋で例えたるわ
コックさんが材料見る時に、キャベツだけ見るんじゃなくて
周りの具材との組み合わせも見ながら焼くタイミング決めてるみたいなもんや
明るい線が太いほど、そこをよく見てるってことやな
31 RGB-D研究者 2024/11/23(土) 12:53:45.34 ID:rgbd4444
ScanNetでの結果が特に印象的やな
屋内環境の難しい条件でもしっかり決まってる
32 マッチング博士 2024/11/23(土) 12:54:23.56 ID:matc7777
最適輸送問題をニューラルネットと組み合わせるの天才的やわ
理論と実践うまく融合されてる
33 深層学習研究者 2024/11/23(土) 12:55:01.23 ID:deep9999
>>32
しかもエンドツーエンドで学習できるのが素晴らしいよな
従来手法みたいにステップ分けなくていい
34 機械学習初心者 2024/11/23(土) 12:55:45.67 ID:ml_n00b1
エンドツーエンドってなんや?
また難しい用語出てきた...
35 コンピュータビジョンの賢者 2024/11/23(土) 12:56:12.34 ID:cv_sage1
>>34
料理で例えると、今までは「切る→炒める→味付け」って別々に練習してたのが
一気に全部まとめて練習できるようになったみたいな感じや
それぞれの工程が互いに影響し合って、より良い結果が出せるんや
36 特徴点おじさん 2024/11/23(土) 12:56:56.78 ID:feat7777
Magic Leap出身の研究者らしいけど、さすがやな
実用性もちゃんと考えてる
37 自己位置推定の達人 2024/11/23(土) 12:57:34.56 ID:loc8888
コード公開してるのも偉いわ
再現性あるのは重要や
38 SfMの専門家 2024/11/23(土) 12:58:12.89 ID:sfm7777
pretrained weightsも公開されてるし
すぐに試せるのがええな
39 画像認識博士 2024/11/23(土) 12:58:56.23 ID:phd6666
これ系の研究って再現性に問題あることも多いのに
ちゃんと動くコード提供してるの素晴らしいわ
40 初心者大学生 2024/11/23(土) 12:59:23.45 ID:stud5555
ワイもコード見てみたけど、確かに分かりやすいな!
コメントもしっかりしてるし
論文PDF
原文
日本語訳
キーワード
このスレのキーワードをスペース区切りで重要な日本語の用語を5つ列挙しください。単語にスペースがある場合は_で置換してください。
特徴点マッチング アテンション機構 最適輸送問題 エンドツーエンド学習 自己位置推定