見出し画像

Validation of a Zero-Shot Learning Natural Language Processing Tool for Data Abstraction from Unstructured Healthcare Data

  1. 本研究の学術的背景,研究課題の核心をなす学術的「問い」は?

  • この研究の学術的問いは、PDF文書に含まれる構造化されていないテキスト情報から、自然言語処理の手法を用いてデータを抽出する方法を開発し、精度と時間的側面で人間の抽象者と比較した際に、時間的側面は効果があるか、精度に関しては手法の適用範囲を確認することです。

  1. 本研究の目的及び学術的独自性と創造性は?

  • この研究は、医療分野で利用されるPDF文書からのデータ抽出を、人工知能による自然言語処理の手法を用いて行えるようにすることを目的としています。独自性と創造性は、データ抽出に関して一般的なモデルを使用している点にあり、偏りのない方法でデータを抽出できることが期待できます。

  1. 本研究の着想に至った経緯や、関連する国内外の研究動向と本研究の位置づけは?

  • 医療において、PDF文書からのデータ抽出は効果的な方法の一つであるが、そのプロセスは手作業による作業員の担当が一般的である。そこで、本研究は自然言語処理によるデータ抽出を実現することにより、プロセスの自動化を目指すものであり、医療の分野においてのAIの適用に関する先駆的な研究と言えます。

  1. 本研究で何をどのように、どこまで明らかにした?

  • 本研究では、医療分野におけるPDF文書からのデータ抽出に人工知能による自然言語処理を用いることによって、作業員による手作業でのデータの抽出に比べて、時間的効率と精度において有効性があることを示しました。また、複数の人工抽象者と比較して、開発された自然言語処理による手法によるデータ抽出の結果が同一レベルであることを示しました。

  1. 本研究の有効性はどのように検証した?

  • 本研究では、人工抽象者と比較して、自然言語処理による手法によるPDF文書からのデータ抽出の結果が同一のレベルであることを示しました。PDF文書の抽出には人間と同じような精度であり、短い時間での抽出を可能とし、多数の文書から多岐にわたるデータをすばやく取り出すことができます。

いいなと思ったら応援しよう!