見出し画像

機械学習モデルで研究論文のインパクトを予測する

▼ 文献情報 と 抄録和訳

知識グラフのダイナミクスを学習することで、インパクトのある研究の早期発見が可能になる

Weis, James W., and Joseph M. Jacobson. "Learning on knowledge graph dynamics provides an early warning of impactful research." Nature Biotechnology (2021): 1-8.

[ハイパーリンク] DOI, PubMed, Google Scholar

[背景] 科学のエコシステムは、引用に基づく指標に依存しているが、これは不完全で一貫性がなく、操作されやすい研究の質の指標にすぎない。DELPHI(Dynamic Early-warning by Learning to Predict High Impact)は、科学文献から経時的に算出された特徴の高次元の関係を自律的に学習することで、「インパクトのある」研究の早期警告信号を提供するフレームワークである。このモデルは、任意の1年間に出版された「トップ5%の論文」を、独自のスコアを用いて予測するものであり、科学者の研究の潜在的なインパクトを、論文の引用回数を利用する指標に依存して計測する既存の書誌学システムを補完できる可能性がある。

[方法・結果] フレームワークのプロトタイプを作成し、バイオ関連雑誌42誌から抽出した。1980年から2019年までの時間構造を持つ論文グラフを対象に、その性能とスケーリング特性を推論した。このグラフには、780万以上の個々のノード、2億100万以上の関係、38億以上の計算された指標が含まれた。1980年から2014年までの19/20のセミナリー・バイオテクノロジーを盲検レトロスペクティブ研究によって正しく特定することでフレームワークの性能を実証し、DELPHIが将来的に時間軸付きノード中心性の上位5%に入ると予測する2018年の50の研究論文を明らかにした。

[結論] このモデルを用いることで、良質な研究をデータ駆動型の方法で見つけ出し、資金提供を円滑にできる可能性がある。

参考資料:Nature Japan 注目のハイライト

▼ So What?:何が面白いと感じたか?

この研究が進んだ先に、よい未来とよくない未来があると思った。

よい未来:査読者間の個別性がなくなり一貫した研究の質に対する査読が可能となる。著者にとっては投稿前に自身の研究論文の質を確認するチェックリストのような役割を果たすツールとなりうる。
よくない未来:一番大きいのは、既存の価値観からみたインパクトのある論文だけが残り、新たな価値観から創造されるかもしれない論文が排斥されてしまう可能性があることだ。さらに、既知のインパクトを及ぼしやすい条件を満たした論文数の割合が増えることで、その条件が作用しなくなる可能性もある。また、ガイドラインが充実しすぎると人間の能力が強化されない、つまり論文執筆の際に著者の論文執筆能力が鍛えられなくなる。

とにかく、まずはこの論文を、さらに熟読してから、応用方法や利点・欠点について考えていきたい。個人的には、それこそ「強いインパクトを持つ研究」だと感じた。