見出し画像

HexAI-TJAtxt: A textual dataset to advance open scientific research in total joint arthroplasty

https://www.sciencedirect.com/science/article/pii/S2352340923008077

  1. 本研究の学術的背景、研究課題の核心をなす学術的「問い」は?
    本研究の学術的背景は、高齢者を中心とした全身関節置換術(TJA)が、全国的に最も一般的で最も速い入院手術プロセスであることです。これにより、TJA患者数の増加と医療の進歩に伴い、日々多くの科学論文が出版されています。これらの論文は、診断、予防、治療戦略、流行病学的要素など、TJAに関する重要な洞察を提供しています。しかし、これらの論文から大規模なテキストデータセットを収集し、TJAにおけるオープンな科学研究のために公開する試みは限られていました。コンピュータによるテキスト分析を利用して、これらの科学文献の大規模なデータセットに迅速かつ効果的に取り組むことで、関節疾患の理解を高め、TJAのケアと臨床成績の向上につながる新たな知識を発掘する可能性があります。

  2. 本研究の目的及び学術的独自性と創造性は?
    本研究の目的は、HexAI-TJAtxtというデータセットを構築することです。このデータセットには、MeSH(Medical Subject Headings)用語を使用してPubMedから収集された61,936件以上の科学的要約が含まれています。このデータセットは自由に公開されており、https://github.com/pitthexai/HexAI-TJAtxt で入手できます。また、PubMedで発表される新しい要約に基づいて、毎月更新される予定です。本研究の学術的独自性と創造性は、既存のTJAに関する科学的知識を統合し、コンピュータによるテキスト分析を通じて新たな知識と洞察を提供するという点にあります。

  3. 着想に至った経緯や関連する国内外の研究動向と本研究の位置づけは?
    本研究は、TJAが広範で急速に成長している手術プロセスであることを背景に、科学文献からタイムリーかつアクセス可能な包括的な情報の需要に対応することを主眼としています。MeSH用語を使用してPubMedから科学的要約の大規模なコレクションを編成することで、HexAI-TJAtxtデータセットはTJAに関連するさまざまなテーマを広範かつ網羅的にカバーしています。また、本データセットはトレンド分析やTJAの臨床的な変化の評価の可能性を提供しています。本研究の位置づけとしては、TJAの理解向上、患者ケアの改善、医療の臨床成績の向上という重要な医療分野への貢献が挙げられます。

  4. 本研究で何をどのように、どこまで明らかにした?
    本研究では、MeSH用語を使用してPubMedから科学的要約を収集し、HexAI-TJAtxtデータセットを構築しました。現在のデータセットには、2000年1月1日から2022年12月31日までの期間にPubMedで発表された61,936件以上の科学的要約が含まれています。このデータセットはテーブル形式(.xlsx、.csv形式)やJSONファイルとして提供されており、さまざまな方法で利用されることが想定されています。

  5. 本研究の有効性はどのように検証した?
    本研究の有効性は、以下のような点で検証されました。

    • 研究の推進:HexAI-TJAtxtデータセットは、TJAに関連する科学的要約の包括的なコレクションを提供し、研究者、臨床医、健康情報学者、医師などが分野の最新の知識を探索し、研究のギャップや領域を特定することを支援します。さまざまな学問領域の研究者は、このデータセットに入り込んで新たな洞察を得たり、関節疾患の理解を深めたりすることができます。
      -広範なカバレッジ:現在のテキストデータセットは、PubMedから収集された61,936件の科学的要約から成り立っており、2000年から2022年までのTJAに関する研究の包括的なコレクションを提供しています。また、PubMedで新たに発表される要約からの2か月ごとの更新も行われます。

    • エビデンスに基づく医学のサポート:HexAI-TJAtxtデータセットは、研究者や臨床医がエビデンスに基づいた意思決定を行うことを支援し、TJAに関連する文献レビューやメタアナリシス、系統的レビューを容易にします。

    • 学際的研究:HexAI-TJAtxtデータセットは、さまざまな学問領域の研究者間の協力と知識交換を促します。整形外科医、遺伝学者、疫学者、データサイエンティスト、AI科学者などの専門家が共同でデータセットを探索し、学際的な研究を促進し、TJAのホリスティックな理解を促進することができます。

    • 迅速なテキスト分析:HexAI-TJAtxtデータセットは、大規模な科学文献に対する計算機によるテキスト分析の機会を提供します。研究者は自然言語処理(NLP)技術、機械学習アルゴリズム、その他の計算ツールを使用して、データセット内の貴重な洞察を抽出し、パターンを発見し、新たな関連性を特定することができます。

    • 将来のデータセットの拡充:本データセットは、将来のデータセットの基盤として機能し、追加の論文の収録や最新の研究動向を反映するための更新を可能にします。

いいなと思ったら応援しよう!