HIGT: Hierarchical Interaction Graph-Transformer for Whole Slide Image Analysis
本研究の学術的背景,研究課題の核心をなす学術的「問い」は?
がんの診断や予後分析に用いられる病理学的な組織スライド画像(Whole Slide Images: WSIs)は、ギガピクセルの解像度を持ち、ピラミッド構造を持つ特性があります。WSIの解析は様々なスケールの情報を捉えることが求められますが、現状の手法ではWSIのピラミッド構造の全体像を捉えることが難しい問題があります。具体的には、地元やグローバルな相関関係のみを特徴付け、異なる解像度間の一方向の相互作用のみを考慮しています。
本研究の目的及び学術的独自性と創造性は?
本研究の目的は、新たな「階層的相互作用グラフトランスフォーマー(HIGT)」を用いて、WSIピラミッドからのローカル情報とグローバル情報の双方を学習し、さらに異なる解像度間の双方向の通信を確立することです。これにより、WSIピラミッドの豊富な多解像度情報をモデル化する能力が向上します。これらの情報は互いに補完的であり、学習過程中にお互いに利益をもたらします。この独自性と創造性は、異なる解像度の情報に対する双方向的な相互作用や、異なるレベルから学習した特徴を集約する「融合ブロック」を導入することにあります。
本研究の着想に至った経緯や,関連する国内外の研究動向と本研究の位置づけは?
病理学的な組織スライド画像(WSIs)分析において、複数のインスタンス学習(Multiple Instance Learning: MIL)が人気の分析手法となっており、近年の研究では注意機構やグラフトランスフォーマーアーキテクチャを取り入れることで、画像パッチ間のローカルとグローバルの相関関係をつかむモデルが提案されています。しかし、これらのモデルは多くの場合、特定の拡大率下での表現学習のみを考慮しており、WSIピラミッドから得られる豊富な解像度情報を無視しています。そのため、本研究は、この問題に新たな取り組みを行い、WSI解析における新たな位置づけとなるでしょう。
本研究で何をどのように,どこまで明らかにした?
本研究では、新たに提案した「階層的相互作用グラフトランスフォーマー(HIGT)」を用いて、WSIのピラミッド構造からローカル情報とグローバル情報を同時に学習することに成功しました。さらに、異なる解像度間で双方向の通信を確立することで、各解像度の情報が補完的になり、互いに学習過程で利益をもたらすことを示しました。これにより、WSIピラミッドの豊富な多解像度情報をモデル化する能力が向上したことを明らかにしました。
本研究の有効性はどのように検証した?
本研究では、キダニー(KICA)と食道(ESCA)のがんに関する2つの公開されているWSIデータセットを使用して、提案した方法を評価しました。実験結果から、階層的かつ非階層的な最先端の方法よりも、我々のHIGTががんの亜型分類とステージングのタスクにおいて優れた性能を発揮することを示しました。