A General-Purpose Self-Supervised Model for Computational Pathology
1. 学術的背景と「問い」:
組織型診断は、形態学的なバイオマーカーを解析する際のコンピューター病理学(CPath)の重要なタスクです。しかし、全スライドの画像化(WSI)は、大規模な画像解像度と形態学的な特徴の多様性がデータアノテーションを困難にしています。既存の研究では自然なイメージデータセットからの転移学習や公開された病理学データセットでの自己教示型の事前学習を用いた学習方法が提案されていますが、まだ十分に開発されていない状況です。
2. 研究の目的と独自性:
我々は、20種類の主要な組織型に対し、10万枚以上の診断用HE染色WSIから百万単位で抽出した組織パッチを使用して、病理学のための一般的な自己教示型のモデル、UNIを紹介します。UNIは、CPathでの診断難度がさまざまな33の代表的なクリニカルタスクで評価されます。
3. 着想と研究の位置づけ:
これまでのCPathモデルは限定的な範囲の症例に適応可能でしたが、多様な病気の診断や予防にはモデルの汎用性が求められていました。本研究は、これまでのCPathモデリングの技術的な問題を克服し、大規模データを活用した自己教示型のモデルを構築しました。
4. 明らかにしたこと:
我々は、いくつかの医療目標に対するUNIモデルの評価を行い、解像度に依存しない組織分類や、少数のクラス原型を用いたスライド分類、さらにOncoTreeコード分類システムにおける最大108種類の癌分類における疾患サブタイプの一般化など、CPathでの新たなモデリング能力を実証しました。
5. 有効性の検証:
UNIモデルは、既存の最先端のモデルを上回るパフォーマンスを示し、一連の診断的に難しいタスクや、臨床的なワークフローに適応可能な、効率的なAIモデルの開発を進めています。これにより、あらゆる組織病理学に対するCPathの有効性と可能性が示されています。