日本の衛星リモセン×AI業界のベースを引き上げ、衛星リモセン技術を使う仲間を増やす挑戦
cvpaper.challenge アドベントカレンダー2024 16日目を担当します。株式会社天地人 / SatAI.challenge / cvpaper.challenge Headauarter(HQ)の中村凌(@ryo123456789098)です。
今年の11/8に「SatAI.challenge」 ( xアカウント@sataichallenge)という、衛星データ×AIの最新論文紹介資料を公開するコミュニティを立ち上げました。 この日、第1回目の資料を公開し、この記事が公開される頃には第3回目の勉強会も終了し、計6本の論文資料が公開されている予定です。
まだ立ち上げ間もないコミュニティですが、こうしてアドベントカレンダーの記事を書くこと自体、挑戦だと感じています。本記事では、SatAI.challengeが誕生した経緯、そして今後の展望についてご紹介します。
この記事を通じて、衛星リモセン×AIに興味を持ってくださる方が増えれば嬉しいです。特に、CV分野の研究者やエンジニアの皆さんに、この分野での研究をぜひ進めていただきたいと思っています。また、本記事をきっかけに、共感していただける新たな仲間が見つかればと願っています。
メタサーベイ実施の背景
衛星データ業界への挑戦
私は今年3月に大学の博士課程と産総研のRA(Research Assistant)を修了し、4月からJAXAベンチャーである株式会社天地人に入社しました。去年までCV分野で研究をしていたため、衛星データに詳しい知り合いはおらず、専門家の価値観や最新のトレンドがまったく分からない状況でした。
入社前はAIを専門的に学んでいたので、衛星とAIの勉強に意欲的で、「まずは仲間探しだ!知り合いを作ろう!」と意気込んでいました。
仲間が集まるコミュニティを探しましたが見つからなかったため、自分で作ってしまおうと考え、その足がかりとしてcvpaper.challengeのメタサーベイに着目しました。
メタサーベイの説明(メタサーベイ何?って人に向けて)
メタサーベイについて知らない方もいらっしゃると思うので、簡単に説明させていただきます。
メタサーベイとは、複数のメンバーが協力して、複数の論文を読み込み、それらの論文から得られた知見をメタ的に分析し、スライドにまとめる取り組みです。
参考までに、過去のサーベイ資料はslide shareで閲覧可能です。
メタサーベイの機会を使って仲間作りへ
このメタサーベイは、個人的に仲間作りの絶好の機会でした。
cvpaper.challengeにはサーベイメンバー用のSlackがあり、2024年12月10日時点で1,715名のメンバーが在籍しています。そのため、無名の私でも募集をかければ、少なくとも1、2名は興味を持ってくれるだろうと期待して呼びかけを行いました。
結果として13名が集まり、予想をはるかに上回る人数となりました。
テーマの募集のときに割と広めのテーマで募集してしまったがゆえに、マッチングが上手くいかなかった人もいましたが、最終的に8名のメンバーとマッチングすることができました。
当初の予想をはるかに超える仲間が集まり、この体制でメタサーベイを実施することになりました。
リモセン学会に参加・CV系の学会との違いを知る
メタサーベイを実施する傍ら、6月の海洋研究開発機構(JAMSTEC) 横浜研究所で開催されたリモートセンシング(リモセン)学会に参加する機会を、弊社からいただきました。
初めてのリモセン学会への参加ということもあり、分からないことが多かったのですが、ポスターセッションの時間には「スーパー質問タイム」を発動して、多くのことを学ぶことができました。
学びだけでなく、多くの方々と交流する機会にも恵まれ、大変有意義で楽しい時間を過ごしました。
しかし、リモセン学会の研究発表の傾向と、メタサーベイで調査した論文の傾向を考慮すると、CV業界ならではの違和感を覚えました。
「なんでそのモデルを使ってるんだろう?」
私が研究していたCV分野では、TransformerモデルをVision用に改良したVision Transformerモデルが主流となりつつあります。しかし、リモセン学会やメタサーベイで扱われている論文の多くでは、依然としてResNetを使用している例が圧倒的で、Transformerを採用している論文は少数派でした。(Vision Transformerの論文は1本だけでした。)
また、発表された論文の中には決定木を使用しているものもありましたが、多くがRandom Forestを採用している一方で、LightGBMやAdaBoost、CatBoostといったアンサンブルやブースティング手法を用いた決定木は、あまり普及していない印象を受けました。
この違和感について、メタサーベイの勉強会や社内のメンバーに相談したところ、多くの方が共感してくださり、使用されているモデルがやや古い傾向にあるという確信に至りました。(このスライドが生まれた背景には、このような経験があります。)
その後、メタサーベイのメンバーとの議論の中で、「時代を切り取るようなサーベイにしよう!」という方針が決まり、モデルの古さに焦点を当てたサーベイのまとめを公開する運びとなりました。
メタサーベイでも触れられているように、リモセンで活用されるモデルが古い理由の一つは、リモセンで検証したい事象が必ずしも最先端のモデルを必要としないためです。最先端のモデルを使うことが必須ではないにしても、より高精度なタスク遂行を目指す場合には、最新のモデルを用いた議論も重要ではないかと考えます。
(メタサーベイ資料は下記の画像に添付してる画像のリンクから閲覧できるので、気になる方は見ていただけると嬉しいです。)
蛇足ですが、上記の資料は、衛星リモセンの専門家にも好評でした。感謝。
SatAI.challengeの構想
メタサーベイ資料を完成させた後、cvpaper.challenge conference summer(CCCS)や国内学会の画像の認識・理解シンポジウム(MIRU)の参加を通じて、普段当たり前のように感じていたCV分野の盛り上がりが改めて凄いと実感しました。
CV分野の多くの学生が国際会議を目指し、高いモチベーションを持って最先端技術の研究に取り組んでいる姿を見て、私が博士課程で過ごしてきた「これが当たり前」という感覚が、他の分野では必ずしも普通ではないのだと、別分野に足を踏み入れて気づかされました。
その一方で、今自分が専門領域としようとしている衛星リモセン×AI分野をより活性化させるためにはどうすればよいか、何ができるのかを真剣に考えるようになりました。そして、その答えの一つが SatAI.challengeです。
CV分野やAI分野では、cvpaper.challengeをはじめ、AI-SCHOLARや日本ディープラーニング協会、Sonyなど、国際論文のまとめ情報を公開しているメディアや個人アカウントが複数存在し、日本語で最新の論文情報にアクセスできます。(例として挙げるAI-SCHOLARは、非常に整然と管理されています。)
こうした環境は、日本の学生や別分野の技術者が最新技術情報をキャッチアップする際のハードルを下げる一助になっており、分野の広がりに大きく貢献していると感じます。
このような背景から、衛星リモセン×AIの最新技術情報を日本語で資料化し、衛星リモセン業界の技術者・研究者・学生、さらには業界を超えた技術者がアクセスできる仕組みを作ることで、衛星リモセン×AIの魅力に気づき、衛星データを活用してもらうことが衛星リモセン業界の人口を増やすために重要だと考え、SatAI.challenge の取り組みを始めました。
一方で、衛星リモセン×AI分野の場合、一部のメディアで深層学習の記事が公開されていますが、衛星系のメディアの多くは、衛星データとユーザーの距離が遠い事もあってか、衛星ビジネスなどがメインで扱われるので、衛星データ × AIに関する最先端の情報をキャッチしたいという狭いニーズ満たすメディアがあまりないというのが現状です。
そのため、衛星リモセン×AIの最新技術情報を日本語で資料化し、業界の技術者・研究者・学生、そして他分野の技術者が容易にアクセスできる仕組みを作ることが、リモセン分野の魅力を広げ、業界人口を増やす上で重要だと考え、SatAI.challenge を始めました。
SatAI.challenge立ち上げついて
メンバー構成
前セクションで述べた動機から、前回のメタサーベイメンバーにSatAI.challengeを立ち上げる旨を伝え、残ってくれたメンバーを中心にコミュニティ活動を始めることになりました。
現在、SatAI.challengeのメンバーは完全に内輪の集まり(メタサーベイ関係者とその知人。招待制で加入できる仕組み)で構成されており、同じ企業に所属する人数が偏らないように配慮しています。これは、「純粋に技術を学び、高めたい」という技術者のニーズに応えるための工夫です。特定の企業に偏りが出ると、ボランティアでその企業に貢献しているような印象を与えてしまう可能性があるためです。
現在のメンバーは10名(+事務局1名)で、勉強会の状況を見ながら少しずつ増やしていく予定です。ただし、メンバーが増えすぎて発言しづらい雰囲気になることは避けたいと考えています。そのため、現時点では内輪のメンバーで構成する方針を採っています。
コミュニティのビジョンと大事にしたい価値観
SatAI.challengeでは、コミュニティのビジョンを明確にし、メンバーが同じ方向性を持って活動できるようにしています。そのビジョンは以下の通りです。
「日本の衛星リモセン×AI業界のベースを引き上げ、リモセン技術を使う仲間を増やす。」
単に勉強会を行うだけでなく、勉強会で得た知見を日本語資料としてアーカイブ化することで、衛星×AI業界の技術ベースラインを向上させ、「衛星リモセン技術って使えるじゃん」と思える仲間を増やすことを目標としています。この目標を意識しながら、チーム全員で勉強会に取り組んでいます。
また、継続的な勉強会を実現するために、以下のコアバリューを設定しています。
参加した時に「勉強になった」を大事にする。
勉強会が継続するために大事な価値観で、発表者は学んだ新しい知識を聴衆者に頑張って伝える。分からないところがあれば聴衆者が議論で質問しながら、論文の本質的な価値を言葉にするのが重要です。
知識を提供してくれた人をきちんと評価する。
知識を提供してくれる人は宝なので、メンバー全員で感謝する。恩返しの意も込めて発表者に深い学びを与えるために聴衆者全員で議論を深ぼる。
さらに、この価値観を実現するために以下の姿勢を意識しています:
紹介していただいた発表の理解を深めようとする姿勢
発表内容に対して分からないことがあれば積極的に聞く。 この質問が発表者や周囲の聴衆者に気づきを与えて、理解を深めるためのきっかけになる。
本質などの気づきがあれば周囲に伝える。 多くの方が技術の本質を学びに来るのでその材料や答えに気付けたら周りの人に伝えてあげる。
発表者が答えれない内容は推測でも良いのでサポートを入れる姿勢
発表者が分からない内容はサポートしてあげる。 このサポートが議論の促進になり、発表者の理解促進につながる。
SatAI.challengeは、全メンバーの学びを最優先に考えながら勉強会を運営しています。
勉強会の運用
勉強会は月2回、2時間の形式で行われます。各回の勉強会では、15分の発表と45分の質疑を1ローテーションとして、これを2ローテーション実施します。特徴的なのは、質疑応答の時間が非常に長い点です。
発表中は質疑用スライドを共有し、参加者が質問内容を書き込めるようにしています。これをもとにパネルディスカッション形式で議論を深め、発表者と参加者が多角的な視点から内容を理解し、重要な知見にたどり着くことを目指しています。
このプロセスを通じて、発表者も参加者もタスクになりすぎない範囲で短い時間で満足度を高めることができ、その結果として得られた発表資料はspeaker deckで公開され、発表動画はYouTubeで配信されています。(SatAI.challengeの資料や動画をまだご覧になっていない方は、ぜひキャッチアップにご活用ください。)
SatAI.challengeの現在と今後
実際にSatAI.challengeの勉強会を始め、3回目の勉強会を終えた時点で、6本の論文資料を公開することができました。今年中にあと1回勉強会を開催する予定であり、これにより今年の資料は合計8本になる見込みです。(まだまだ少ないですね。)
勉強会を重ねる中で、メンバー全員がSatAIの運用形式に慣れ、質の高い議論や1本の論文への深い理解が継続的に行えるようになってきたと感じています。(特に、第3回勉強会でぴっかりんさんが発表を終えた際、非常に楽しんでいただけた様子が印象的で、このスタイルを選んでよかったと改めて実感しました。)
ただ、現在の勉強会モデルでは、開催されるたびに2本ずつ資料を公開する形式のため、2×勉強会の回数しか増えていかないのでスケールしにくいという課題点のようなものがあります。特にAI分野では、マルチモーダルAIの発展により分野間の境界が薄れ、より多くの論文に効率的に目を通す必要性が高まっているため、更に多くの論文の資料をアーカイブ化することが大事だと考えています。現状の2×勉強会の回数でしか論文が増えていかない状況を考えると、現在のSatAI.challengeの勉強会だけでなく、多くのメンバーとのコラボを想定した勉強会を開催し、そこで使用した資料を公開し、マンパワーで品質を担保した資料をアーカイブ化していくことが重要であると考えます。
SatAI.challenge 主催で勉強会を開催します!
来年の挑戦として、SatAI.challenge主催で、connpassを活用した勉強会を4月に実施します!
この勉強会は、SatAI.challengeの立ち上げのコアとなったメタサーベイをベースに、衛星リモセン×AIを学ぶ多くの方々とコラボレーションし、メタサーベイ資料の作成を目指すものです。勉強会では、参加者に「論文紹介」をベースにした発表を行っていただき、発表資料をもとにSatAI.challengeのコアメンバーが「論文のまとめのまとめ(メタサーベイ)」を作成します。
その際に、作成した方の名前は発表資料に共著者として記載させていただき、勉強会を通して、皆で1つの資料を作っていくための勉強会です。
完成した資料は、SatAI.challengeメンバーによる追加・整理作業を経て、最終的にspeaker deckで公開する予定です。
また、今回の勉強会では、メタサーベイの作成を念頭に置きつつ、テーマに沿った発表を行っていただきます。テーマは「衛星データを活用したマルチモーダルAI」です。このテーマをもとに、衛星リモセンと他分野との融合の可能性をまとめ、衛星リモセンの新たな可能性を探っていきます。
勉強会の詳細については、connpassのイベントページをご覧いただけると幸いです。興味をお持ちの方は、ぜひチェックしてみてください!
この記事を読んで、「日本の衛星リモセン×AIを盛り上げたい!勉強したい!」と思っていただけたら、ぜひ一緒に勉強会を盛り上げていきましょう!
現在、衛星リモセンのAI技術の多くはコンピュータビジョン分野からの輸入です。今年10月に開催されたコンピュータビジョンの最高峰会議であるECCVでは、衛星リモセンを活用したマルチモーダルAIが注目され、衛星データの活用が非常にホットなトピックでした。(詳細はこちらの記事をご覧ください。)
衛星リモセンで扱われるデータが色んな分野で価値を発揮すれば、今よりも分野は興味を持つ人が増え、より分野が賑わうはず。そのためにも、皆で分野を盛り上げ、多くの人を巻き込めるように、簡単にキャッチアップできるように共に活動をしていきましょう。まだまだ衛星リモセン×AIは面白くなる。面白くするのは私達日本メンバーのみんなで。学生の皆さんの参加も大歓迎です。一緒にこの分野を盛り上げ、未来を切り開いていきましょう!
最後に、日頃、SatAI.challengeを支えてくれているメンバーの皆さん、特に尽力的にサポートしてくれている篠原さん、感謝しています。いつも楽しい議論ができていて、すごく良い仲間と勉強会を実施できていてとても幸せです。その他に、コミュニティ運営のいろはをOJTを通して学びを与えてくれたHQメンバー片岡さん、リサーチポート高田さん、長谷部さん、福原さん、山田くんと勉強会の極意を教えてくださった岡山大の中原先生にも感謝しています。
2024.12.16
中村 凌