研究トレンドを創出するチームビルディング
筑波大学 博士課程1年 / 産総研RAの山田亮佑と申します。
昨年の「AIスターに俺はなるっ!」という記事を執筆してから早1年が経過しようとしています。
今年は、コンピュータビジョン分野にて難関国際会議と称されるCVPRに主著・共著含めて2本採択されることができました。
一方で、CVPR以降に投稿した論文はRejectが多かったり、主著のプロジェクトでは良い結果が出ずsubmissionすらできなかったりと悔しい思いをする出来事も非常に多い1年でした。
まさに、『人間万事塞翁が馬』と思える1年でした。
https://hirokatsukataoka.net/temp/presen/220728MIRU2022.pdf
CVPR2022に採択された2本の論文に関しては、以下よりコードも公開しておりますので、ご興味ある方は参考にしていただければ幸いです。
1. Replacing Labeled Real-Image Datasets with Auto-Generated Contours
2. Point Cloud Pre-training with Natural 3D Structures
私の振り返りはさておき、今年の「研究コミュニティ cvpaper.challenge 〜CV分野の今を映し、トレンドを創り出す〜 Advent Calendar 2022」では私がグループリーダーを担当するFormula-Driven DataBase (FDDB) グループの研究体制等について紹介しようと思います。
特に、FDDBグループではどのような研究メンバーが、どのように研究を進め、難関国際会議へ挑戦しているのか、個人レベルではなくチームレベルでの視点でお伝えできればと思います。
※この研究体制が必ずしも正しいというわけではないではありません。
また、今回は記事の内容上、グループリーダーという視点から私の考えを執筆しています。が、まだまだ学生であり、マネジメントのプロフェッショナルでもないのでお手柔らかにに読んでいただければと思います。
Formula-Driven DataBase (FDDB) グループ
昨今の深層学習モデルにおける重要なテクニックの1つとして「事前学習」という技術が存在します。事前学習とは、大量かつ汎用的なデータを事前に学習した深層学習モデルを活用することで、認識精度の向上や学習時間の短縮に寄与することが知られています。
特に、事前学習を用いることで少量データでも深層学習モデルを導入しやすくなることから、学習データを準備することが困難である医療現場等への応用が期待される技術になります。
FDDBグループでは、「実データを一切使用せずに事前学習を実現することができるのではないか?」という仮説から、何かしらの法則・規則性に基づきデータ及び教師ラベルを自動生成することで、より良い事前学習モデルの提案することを目標に日々研究しているグループとなります。
さらにその先には、「本当に事前学習に重要な要素は何か?」、「自然画像とは何か?」というコンピュータビジョン分野の根底にある疑問に迫ることをグループの目的としています。
最近では、IJCV/AAAI/IROS/CVPRとFDDBグループからは数多く難関国際会議・トップジャーナルにも採択されるようになってきました.また、アルムナイ、アドバイザ含めて48名のメンバーが在籍しており、グループ設立時と比較して非常に大きくなりました。
ありがたいことに研究成果を記事として取り上げていただく機会が増えました。以下、参考記事になります。
大量の実画像データの収集が不要なAIを開発(産業技術総合研究所)https://www.aist.go.jp/aist_j/press_release/pr2022/pr20220613/pr20220613.html
産業技術総合研究所(産総研)公式Twitter
画像認識AIの事前学習に写真がいらなくなる?新技術「FDSL」登場!
https://nazology.net/archives/113386
また、FDDBグループで数式ドリブン教師あり学習とその周辺分野に関してメタサーベイ資料も公開しております。ぜひ、ご参考ください。
【メタサーベイ】数式ドリブン教師あり学習
FDDBグループの研究体制とは
cvpaper.challengeでは「コンピュータビジョン分野の今を映し、新しいトレンドを創り出す」ことをビジョンに掲げ活動しています。
その中で、FDDBグループがやるべきことは非常にシンプルです。
新たなトレンドを創り出す研究を、一人でも多くの人が目に触れる形で世の中にアウトプットすることだと思います。
その中で、グループリーダーの役割の1つは、アウトプットできる確率を少しでも上げるために、グループメンバーを様々な面からマネジメント・サポートし、チームビルディングしていくことだと考えています。
近年、コンピュータビジョン分野は目覚ましいスピードで技術が進化しており、サーベイから問題設定の立案、実装、実験、論文執筆に至るまでのサイクルを非常に高速に回す必要があります。
そのスピード感で全ての研究プロセスを一人で完璧にこなすには高いスキルが必要ですし、研究を始めたばかりの学生さん(私含む)には極めて実行することが難しいことです。
「新しいトレンドを創り出す」という挑戦は、つまりそういうことなんだと思います。がしかし、「新しいトレンドを創り出す」ためには、必ずしも一人で全てを実行しないといけないわけではありません。
ここで、少し話が脱線してしまいますが、CVPR2023への投稿締切後、気分転換にと久しぶりにOCEAN'S ELEVENを鑑賞しました。
OCEAN'S ELEVENでは、ダニー・オーシャン(ジョージ・クルーニー)率いる11人の犯罪チームでラスベガスにあるカジノから大金を盗み出すという物語です。(注: 犯罪はダメゼッタイ)
ここで重要なことは、メンバー間で共通の目的を達成するために、11人それぞれの得意なことを最大限に活かしつつ、相互的に補完し合うことで通常以上のパフォーマンスを発揮している点にあります。
(余談ですが、私がAIスターになろうと決心した日の片岡さんの「AIスターになろう!」の講演にもOCEAN'S ELEVENが紹介してありました。)
現在のFDDBグループ体制として一番近いのは、まさにこのOCEAN'S ELEVENかと思います。直近でいくと、CVPR2023への採択に向けてOCEAN'S ELEVEN likeなチーム体制を複数構築し、切磋琢磨して3本を投稿することができました。
まず、プロジェクト全体を完璧に把握し管理するプロジェクトのリーダー役であるダニー・オーシャンは絶対必要で、この人がいないとプロジェクトが破綻します。次いで、必ずしも居なくても成り立つといえばそうなのですが、その右腕・補佐役のラスティ・ライアン(ブラッド・ピッド)がいると研究が劇的に進み出します。アドバイザがいなくてもリーダー役・補佐役でプロジェクトごとの打ち合わせ間に個別かつ密に(おそらく週3回以上のペースで)議論を交わして最低限2人で進めてくれます。
その他、データセット構築に特化した人、大量の実験を管理し打ち合わせに必ず間に合わせてくる人、実装に特化して要求を受けたら即日実験プログラムを書き上げてくる人、テクニカルライティングに長け論文を高速に仕上げてくる人、論文が共有されると数時間内にはチェックして膨大なコメントを返却する人、どんな無理難題も解釈してイイ感じの図表を仕上げてくれる人などなど、論文単位を想定したプロジェクトごとに個別化して、適切な人員を配置してチームを作り上げます。
各プロジェクトで様々な粒度の役割に細分化させることで効率的に論文を仕上げることができる体制にしていきます。昨今のAI分野においては、研究テーマに拘ること、実験戦略を考えることはもちろんですが、"如何にチームを構築するか、状況に応じて組み替えていくか"こそが重要要素であると考えています。
チームビルディング後は…
もちろん、締切ドリブンでチームを構築したとしても、それだけでは基本的には上手くいきません。特に、cvpaper.challengeはコミュニティの性質上、他研究機関のメンバー同士でチームを結成することが多いです。そのため、ミーティングを設定しなければ気楽に雑談しながら研究のことについて話すことは難しく、コミュニケーションの敷居が非常に高いことが問題としてあげられます。こちらに関しては後述しますミーティング(FDDB Hacks)によって劇的に解消することができました。
また、論文投稿の経験がない学生さんにとっては、投稿に必要な実験量やスケジュールの感覚など含めて分からないことだらけです。気づいた時には手遅れという状況になってしまいます。
ここに関しては、グループの人数が増えてきたこともあり、現在ではグループリーダーのみならず複数のアドバイザの先生方と連携しながらマネジメント・モチベーション管理をしています。
もちろん理想的には問題設定の立案から実装、論文執筆に至るまで全ての研究プロセスを適切にサポートしたいところなのですが、残念ながら私にはまだそこまでのスーパーヒーロー的能力を兼ね備えていません。なので、サポートできる部分はかなり限られてしまいます。
ですが、サポートしてくださるアドバイザの先生方とグループメンバーの潤滑油になることは可能ですし、学生だからこそメンバーに近い存在としてグループ全体を鼓舞することができると思っています。
逆にその点では同じグループリーダーである片岡さんやアドバイザの先生方とうまく分業できていると思っています。良く言えば、マネジメントにおけるOCEAN'S ELEVENといったところでしょうか。
具体的な研究の進め方等に関しては以下の資料を参考にさせていただきながら、可能な限りプロトタイプを早期に作ることを意識して(私は)各メンバーにはコメントしています。
私自身も学部時代から参考にさせていただいて、研究を進めていました。
今後の研究会のあり方 -海外の事例から見た研究の進め方と国内コミュニティ-
https://www.ieice.org/iss/prmu/jpn/GC/PRMU201710_Sugano.pdf
今後の研究会のあり方 研究サイクルと国内の研究会運用
FDDB Hacks
FDDBグループでは、以下に示すように週に2回(各2時間)の進捗報告と実装チュートリアル(作業時間)からなるミーティングを設定しています。このミーティングはメンバー間でFDDB Hacksと呼んでいるため、以降、FDDB Hacksと呼ばせていただきます。
研究プロセスの中で重要な要素の1つがミーティングの質だと考えています。グループメンバーが増加してきた時期から明らかにFDDB Hacksの生産性が低下していることを感じていました。
オンラインミーティングの性質上、複数人が同時に並行して発言し、議論することは不可能です。そのため、一人当たり議論できる時間は明らかに短くなり、メンバー自身も保守的になっていることが多々ありました。その場合には、グループリーダーからのコメントのみになってしまいがちです。このようなミーティングでは研究スピードの向上につながるどころか、参加すること自体をストレスに感じてしまいます。
これはつい先日、イーロン・マスク氏がテスラ社員に送ったとされ話題となった生産性に関する6箇条のメールにもミーティングに関して記載されていました。
生産性向上のための6箇条
Avoid large meetings
Leave a meeting if you're not contributing
Forget the chain of command
Be clear, not clever
Ditch frequent meetings
Use common sense
そこで、FDDB Hacksではブレイクアウトルーム機能を用いて3~4人の小グループに分割し、メンバーを入れ替えながら進めることで大人数でのミーティングを避けるようにしています。これにより、参加メンバーの参加意識を向上させ、グループリーダー以外のメンバーが保守的にならず、全員がContributerにならざるをえない環境を意図的に作り出しています。
また、基本的には参加メンバーにはカメラオンを推奨しています。これも参加意識を高めるため有効な1つの手段です。
しかしこれだけでは、求めているほど活発に議論は生まれません。それは、やはりメンバー間の関係性の希薄さが原因です。先述したとおりcvpaper.challengeは大学の研究室と違い毎日顔を合わせるわけではありません。ましてや、地方大学のメンバーもいるため全員が一度に集まるミーティングの開催は極めて難しいです。
そこで、FDDBグループでは週に2時間、実装チュートリアルと言う名の共同作業時間を設定しています。この時間では、各メンバーがもちうる研究を効率化するためのTipsを紹介し合ったり、輪講形式でサーベイした論文を共有しあったり、面白い論文のGitHubをみんなで一緒に動かしてみたりしています。
表上は「実装/研究Tips等を共有して実験を効率化する」ことが目的なのですが、真の目的は「メンバー間のコミュニケーション時間を確保すること」です。つまり、あえて雑談できるような状況を作り出しています。コロナ禍になり作り出すしかないのかもしれませんが。
そして、メンバー間の関係性が構築できるまである程度の時間が必要ですが、それまでは誰かしらがファシリテーターの役割を担うことが重要です。
OCEAN'S ELEVEN likeなグループ体制を超えていくために
ここまでFDDBグループのグループ体制について紹介してきましたが、これが最善の体制だとは思っていません。まだまだ伸び代は十分にあると考えています。つまり、OCEAN'S ELEVEN likeなグループ体制に甘んじてはいけないということです。
OCEAN'S ELEVEN likeなグループ体制では、現時点のグループが持ち得る能力から出される最大以上の力を発揮する可能性を秘めています。さらに、各メンバーが別々の得意分野を持ち得た集団に属することで、自身に足りないスキルを学び成長することもできます。
一方、個々が現時点の能力(役割)に甘んじたままではグループとしての成果はある一定ラインで頭打ちになってしまうかもしれません。いわゆるOCEAN'S ELEVENを超えることはできません。
OCEAN'S ELEVEN likeなグループ体制を超えるためには、各メンバーが自身の持ちうる得意分野を広げ、グループに還元させていくことが重要です。
例えば、論文執筆に秀でたメンバーのみが全プロジェクトの執筆を行っていても論文執筆における生産性は向上しません。時間内に書き上げれる論文数には限りがあります。仮に実装に秀でたメンバーが多数おり実験スピードがはやくとも論文執筆がボトルネックとなり、完成度の高い論文を完成させるまでには時間を必要としてしまいます。なんなら、論文執筆メンバーの負荷が凄まじいことになってしまいます。
だからこそ、OCEAN'S ELEVEN likeなグループ体制を超えるためには各グループメンバーが現状に奢らず学ぶ姿勢を忘れてはいけません。
そして、各メンバーが流動的にどこのポジション(研究プロセスにおける役割)についても、そのチームではスペシャリストになれるグループ体制になった時、はじめてOCEAN'S ELEVEN likeなグループ体制を超えたといえるのではないでしょうか。そして、その時にはCVPRに10本前後は投稿・採択されています。
FDDBのグループリーダーとして
かれこれ約2年半近く、cvpaper.challengeにおける研究グループのリーダーを担当してきました。本記事で説明したこと以外でも、グループ全体として意識して取り組んでいることはたくさんあります。逆に言うと、難関国際会議に複数本投稿・採択される研究グループを構築するには、それだけ運営に時間と労力が必要であるということなのかもしれません。
これらのことは頭では分かっていても実行するには非常に根気が必要です。場合によっては、自分の貴重な作業時間をただ犠牲にすることになりますし、見方によっては損な役回りにうつるかもしれません。しかし、中長期的な観点でいくとグループ運営を疎かにすることは、研究メンバーの不満を招き、コミュニティが縮小していく原因になってしまいます。
また、大前提に我々は「コンピュータビジョン分野の今を映し、新しいトレンドを創り出す」というビジョンの実現を本気で目指している集団です。
だからこそ、ビジョンを共感しあい、モチベーションを保ち、楽しく研究していく体制を構築することは非常に重要だと思います。
ということに気づけたのも何もわからない修士1年時から、グループリーダーとしての機会をいただき、ある程度の裁量権を与えていただくことで責任感が生まれたことで、マクロな視点でコミュニティ・グループ全体を俯瞰することができていたのかもしれません。
気づいた時には、世界のトップラボがどのような研究チーム体制で進めているのか、我々とは何が違うのか、どのようにしたら国際会議に複数本採択されるレベルまで到達できるのか等、個人レベルではなく、グループレベル、もっというと国レベルでの視点で研究体制を考えるようになっていました。
まずは、自分自身が一人前の研究者になることが先な気がするのですが…
余談: 以下の動画はチーム体制と直接関係することは少ないですが、チーム体制についてを考えていた時、世界的に著名な先生方の考え方に何かヒントは転がっていないかと必死に見ていたHuman of AI シリーズです。
ちなみに以下の動画は、Jitendra Malik先生とDevi Parikh先生の対談動画です。このシリーズ面白いので個人的におすすめです。
最後に
私としては、cvpaper.challengeのビジョンに共感していただき、高い研究意欲、向上心を持って自ら応募してきてくれた研究メンバーとは一緒に楽しんで研究したいと思っています。また、cvpaper.challengeに入り、他研究機関メンバーとの交流を通じて研究に対する様々な知見を手に入れ、主に活動する研究・業務に対して相乗効果を生み出せることが理想的だと思います。
ここに書いたことはグループ運営のほんの一部にすぎず、私自身もFDDBグループのメンバーに気づかないうちにたくさん助けてもらっています。そして我々の研究体制もまだまだ改善するところばかりです。引き続き、グループ全員で改善していこうと思っています。
研究を楽しみ、仲間を大事にし、苦楽をともに乗り越え続けた先に「コンピュータビジョン分野の今を映し、新しいトレンドを創り出す」というビジョンの実現が待っています。
FDDBグループでは一緒に挑戦してくれるメンバーを募集中です。
以下の応募リンクからご応募ください!!!
今年も最後に、私の原点である言葉で締めようと思います。
AIスターに俺はなるっ!
2022.12.3
山田亮佑