米マサチューセッツ工科大学、ロボットのタスク認識を進化させる新手法「Clio」を開発
2024年9月30日、米マサチューセッツ工科大学(MIT)の研究チームは、ロボットが環境内の物体をタスクの関連性に基づいて直感的に認識し、優先順位を付ける手法「Clio」を開発したと発表した。
Clioは、ロボットがシーンの重要部分のみをマッピングし、たとえば散らかった部屋からオレンジ色のバックパックを探すなどのタスクを完了するための仕組みである。実験では、米Boston Dynamics社の四足歩行ロボット「Spot」を使用し、Clioが不要な事務用品を無視して犬のおもちゃを見つけるなど、タスク達成に成功した。Clioは高度なコンピュータビジョンと言語モデルを活用し、数十億の画像とテキストデータで訓練されたニューラルネットワークに基づく。タスクに応じて物体の識別レベルを動的に調整できる点が特徴で、複雑な環境にも柔軟に対応する。たとえば、複数の本を一つの物体として認識する一方、特定の一冊が必要な場合にはそれを識別することが可能である。
研究チームは、Clioを雑然としたアパートやオフィスで実証実験を行い、情報ボトルネック(information bottleneck)技術によりタスク関連物体をリアルタイムでマッピングすることに成功した。今後は、捜索救助など高度なミッションへの応用が計画されており、Clioの技術は災害対応や製造業など幅広い分野での活用が期待されている。
出典:
2024年9月30日付 マサチューセッツ工科大学 プレスリリース(英語)
https://news.mit.edu/2024/helping-robots-focus-on-objects-that-matter-0930
https://dspace.mit.edu/handle/1721.1/157072
2024年9月30日付 Techxplore(英語)
https://techxplore.com/news/2024-09-method-enables-robots-scene-tasks.html