MERGE: A model for multi-input biomedical federated learning
https://www.sciencedirect.com/science/article/pii/S2666389923002404
本研究の学術的背景や問いは、大量のデータセットで訓練された深層学習モデルが、異なるサイトやソースからのデータを集めることを必要とする一方で、バイオメディカル研究のようなデータ規制がある敏感な情報を扱う研究分野では、データプーリングがデータアクセスや機関間のデータ共有に関する懸念を生むことです。このような懸念を解消するために、データではなくモデルを異なる機関間で共有する協調学習パラダイムであるフェデレーテッドラーニングが提案されています。
本研究の目的は、画像と表形式のデータを使用したフェデレーテッドマルチ入力アーキテクチャを提案し、モデルのパフォーマンスを向上させつつデータプライバシーを保護する方法を示すことです。また、学術的な独自性と創造性は、フェデレーテッドラーニングのマルチ入力分類タスクを、複雑な垂直フェデレーテッドラーニングからより直接的な水平フェデレーテッドラーニングの枠組みに変換するアプローチを提案していることにあります。
本研究の着想は、深層学習(DL)の革命により、人工知能(AI)が診断画像の分析や分類など、多くのバイオメディカルタスクの基本的なツールとなったことから来ています。しかし、画像だけが情報源ではありません。個人情報やゲノムデータ、血液検査結果などの表形式のデータも定期的に収集されていますが、深層学習のパイプラインではほとんど考慮されていません。
本研究では、画像と表形式のデータを使用したフェデレーテッドマルチ入力アーキテクチャを提案し、COVID-19の予後とアルツハイマー病患者の層別化の二つのケースで評価しました。結果として、単一入力モデルと比較して精度とF1スコアが向上し、非フェデレーテッドモデルと比較して汎用性が向上したことを示しました。
本研究の有効性は、COVID-19の予後とアルツハイマー病患者の層別化の二つのケースで評価し、単一入力モデルと比較して精度とF1スコアが向上し、非フェデレーテッドモデルと比較して汎用性が向上したことを示すことで検証されました。