Explainable multi-task learning improves the parallel estimation of polygenic risk scores for many diseases through shared genetic basis
1. 本研究の学術的背景、研究課題の核心をなす学術的「問い」は何ですか?
本研究の学術的背景として、複数の疾患には共通する遺伝子決定因子が存在し、人口における共病性も高いことが指摘されています。本研究の課題は、多様な疾患のポリジェンリスクスコア(PRS)を同時に改善する手法の開発で、共病性に着目し共通する遺伝子決定因子を利用してPRSスコアの改善を図ります。
2. 本研究の目的及び学術的独自性と創造性は何ですか?
本研究の目的は、疾患間の共通要因を利用して、複数の疾患のPRSスコアを同時に改善することです。複数の疾患のポリジェンリスクスコアを同時に改善することに着目したマルチタスクラーニングアプローチを提案して実験を行いました。その結果、パンがんモデルにおいて17種類のがんに対するPRS予測は、単独のがんに対するPRS予測のモデルよりも高い精度を示しました。また、この手法は、60種類の非がん疾患に対しても有効であることが示されました。
3. 本研究の着想に至った経緯や、関連する国内外の研究動向と本研究の位置づけは何ですか?
既存の研究では、複数の疾患のポリジェンリスクスコアを開発し、それぞれの疾患において個別に統計学的手法を用いたアプローチが取られてきました。一方、本研究では、複数の疾患のポリジェンリスクスコアを同時に改善するためのマルチタスクラーニングアプローチを提案し、新しい手法を開発しました。
4. 本研究で何をどのように、どこまで明らかにした?
本研究では、様々な疾患のポリジェンリスクスコアを同時に改善し、一般的な神経ネットワークアーキテクチャに基づくマルチタスク学習アプローチを開発しました。評価の結果、複数の疾患に対するポリジェンリスクスコア推定の精度の向上が確認されました。これにより、多くの複雑な疾患に共通する遺伝子リスクがあることが示唆され、それがマルチタスク学習において知識の正の転移に寄与することが分かりました。
5. 本研究の有効性はどのように検証した?
本研究では、マルチタスク学習アプローチによって多数の疾患のポリジェンリスクスコアの同時改善が可能であることを示しました。固有の遺伝子因子やポリジェンリスクスコアが疾患間で共通することを示す証拠も見つかりました。それにより学習結果の正当性が確立されたと言えます。