見出し画像

【AI/DX事例解説】AIでカルテ情報を認識して新型コロナウイルスに対抗する

ESTYLEのデータサイエンス事業部新メンバーの筒井です。

近年、多くの企業で「DX化」という言葉が聞かれますよね。「DX化」はビックデータの活用・AIの導入など、進化したIT技術でビジネスや生活をより豊かにしていこうという動きです。特にAIの導入・活用はここ最近のトレンドとも言えるでしょう。

しかし、AIの活用と一口に言っても、そもそもどういったケースでAIを役立てることができるのかいまいちイメージが浮かばないという方もいるかもしれません。
そこで今回は、AI活用のケーススタディとして、医療業界での新型コロナウイルス治療におけるAI活用例をご紹介します。DX化やAI・機械学習に興味のある方は、ぜひご覧ください。

紹介記事の概要

カルテからパターンを探索し新型コロナウイルスに関する知見を得る

今回紹介するAI活用例は、2020年10月に海外のジャーナルサイトに公開された下記の記事です。

----------------------------------------------------------------------------

Teaching computers to read health records is helping fight COVID-19
https://theconversation.com/teaching-computers-to-read-health-records-is-helping-fight-covid-19-heres-how-147385[1]

2020年10月19日公開

筆者:James Teo(神経内科医、データ・AIの臨床ディレクター、キングス・カレッジ・ロンドン臨床上級講師)、Richard Dobson(キングス・カレッジ・ロンドン 健康情報学教授)

----------------------------------------------------------------------------

記事のタイトルをそのまま訳すと、「健康記録の読み方をコンピュータに教えることは、新型コロナウイルスとの戦いの手助けになる」でしょうか。
医療現場では、カルテをはじめとして、患者の健康状態に関する膨大な医療記録データがあります。この記事では、医療記録をコンピュータに学習させ共通するパターンを見つけ出すことで、新型コロナウイルスに対抗するヒントを得る、といった内容になっています。

しかし、コンピュータにカルテ等の医療記録を学習させるといっても、簡単にはいきません。カルテ等の医療記録に記載されている内容は、まるでメールでも書くようなイメージで医者が自由に書いていったものです。患者の既往症の有無や病気の進行状況、家族構成などがまぜこぜに書いてあり、しかも略語を使ったりタイプミスがあったりと、機械が読むには非常に難しいのです。

そこで、まずはAI分野の技術の一つ、NLP(自然言語処理)を利用して医療記録を分析し、そこから得られたデータを機械に学習させ、新型コロナウイルスの罹患症状と関わりのあるパターンを発見していきます。

NLP(自然言語処理)とは?

膨大なテキストデータを分析するために人間が扱う言葉をコンピュータに処理させること

画像1

記事の詳細を解説する前に、NLP(自然言語処理)について簡単に確認しておきましょう。NLPとはAI分野の一つで、人間が使う言語を分析し、言葉が持つ意味をコンピュータで解析する処理技術です。

我々人間が使っている日本語や英語をはじめとした言語は、一つの文章でも複数の解釈の方法があるなど、曖昧さを含んでいます。こういった言語は「自然言語」と呼ばれます。曖昧さを含む言語は、人間には理解できてもコンピュータにとってはなかなか理解し難いものです。というのも、コンピュータが扱う言語(プログラミング言語)は、文法や意味が明確に定義されており、曖昧さが排除されているためです。

そこで、人間が扱う自然言語をコンピュータも理解できる形に解析していく処理が必要になります。それが、自然言語処理です。自然言語処理は、機械翻訳や自動対応のチャットボット、スマホやパソコンのかな漢字文字変換予測などで活用されています。

医療記録は膨大。人間ではなく、機械に学習させよう

さて、ここから記事内容の詳細を解説していきます。
医療記録というものは、健康に関するデータの宝庫です。情報を組み合わせて活用すれば病気の理解やより効果的な治療に役立ち、それは新型コロナウイルスも例外ではありません。
しかし、医療データを分析するといっても、その量は膨大。人間が分析するのでは時間がかかりすぎてしまいます。

そこで筆者の研究チームは、機械に医療データを学習させ、何千という患者のデータからパターンを見つけ出し、新型コロナウイルスに対抗するためのヒントを発見することを目標とします。

生の状態のデータは機械が学習できない

カルテ内の重要な内容を探すことはコンピュータにとって難しい

医療データを機械に学習させる際、ある問題が生じます。医者が記入したカルテ等の医療記録は、そのままではコンピュータが理解できないのです。例えば、医者が記載するカルテの中に、下記のようなものがあったとしましょう。

----------------------------------------------------------------------------

ミス・スミス
65歳の女性、心房細動の症状あり。3月にCVAを発症。過去に#NOFとOAの病歴あり。乳がんの家族歴あり。アピキサバンを処方。出血の既往無し。

----------------------------------------------------------------------------
たった2行の中に、スミスさんの健康情報が凝縮されています。時系列もバラバラに書かれ、CVA、NOFなどの略語も含まれていますね。また、忙しい医者が書いたものなので、タイプミスがあったり、内容が不正確だったり場合もあります。このようなカルテの内容を理解し、どの情報が重要なのか人間には理解できますが、コンピュータには難しいです。

NLPを通して機械に読み方を教える

そこで、筆者の研究チームはNLPで医療データを分析していきます。

まず、機械学習をベースにアルゴリズムを作成し、医療データ内で使用されている言語をコンピュータが分析できるように標準化・構造化された医学用語のセットへと翻訳します。
そして、コンピュータに文脈や単語、医療的な概念の理解や、家族関係の特定、現在と過去の出来事の区別といった作業に行わせます。

これらの作業ができるように、研究チームはコンピュータに既存の文字情報(インターネットから取得したパブリックな英語テキストなど)を与えて言語の構造と意味を学ばせ、さらに実際の医療記録を使って改良とテストを行いました。

AIによって見出されたパターンとは?

NLPによって医療データを処理することで、筆者の研究チームは、新型コロナウイルスに関連するパターンを見出すことができるようになりました。

パターン分析結果の例として、記事内では、高血圧や糖尿病などの治療のために処方されるアンジオテンシン変換酵素阻害薬(ACEIS)やアンジオテンシン受容体拮抗薬(ARB)が、新型コロナウイルス重症化の可能性を高めるかどうかの調査が紹介されています。
NLPを活用して新型コロナウイルスの患者1,200人の匿名記録を分析し、患者がACEISやARBの服用の有無と臨床結果を比較した結果、ACEIやARBSを処方されている人は、薬を服用していない人に比べて重症化のリスクは高くないことを発見しました。

さらに研究チームでは、新型コロナウイルスのリスクが最も高いのは誰か、民族や既往症との関連性はあるか等を調べるために、上記のNLP技術の使用を拡大しています。

また、入院した患者が重症化する可能性を予測する「早期警告スコア」を評価したり、新型コロナウイルスの患者数の急増を予測するためにも、この技術を利用しているとのことです。

まとめ

今回ご紹介した記事では、新型コロナウイルスとその他の病気の関連性を分析するために、NLPをはじめとしたAI技術が活用されていました。また、患者の重症化リスクの予測や、今後の患者数の増加状況の予測などにもAIが使われています。

新型コロナウイルスでは感染者急拡大に伴う「医療崩壊」が大きな問題になったこともあり、重症化リスク予測・患者増加予測を医療現場で使えるようになれば、非常に役立つのではないかと思いました。

医療のような命に関わる分野において、人間の目だけでは把握しきれないリスクの発見・予測をすることができるAIは、ますます大きな存在になっていくのではないでしょうか。
今回は医療分野に関する記事をご紹介しましたが、今後も引き続きさまざまな分野でのAI活用例をご紹介していきますので、ぜひご覧ください。

リンク

[1]Teaching computers to read health records is helping fight COVID-19
https://theconversation.com/teaching-computers-to-read-health-records-is-helping-fight-covid-19-heres-how-147385

採用情報

ESTYLEは、「コウキシンが世界をカクシンする」という理念のもと、企業のDXを推進中です。経験・知識を問わず、さまざまな強みを持ったエンジニアが活躍しています。

未経験文系からデータサイエンティストへ

弊社では、スキルや経験よりも「データを使ってクライアントに貢献したい」「データ分析から社会を良くしていきたい」という、ご自身がお持ちのビジョンを重視しています。

ご応募・問い合わせはこちら

この記事が気に入ったらサポートをしてみませんか?