北米放射線学会(RSNA)の医療AI教育セッションの抄録を読んでまとめてみました
整形外科医の中原と申します。医療画像のAI研究を行っています。
# 3行要約
北米放射線学会のAI教育セッションを抄録だけ読んでまとめた
医療AIは経営視点ではワークフロー改善、臨床視点では画像の数値化
米国では医療系学会でも画像生成やNLPのハンズオンが行われている
# はじめに
AI関連の情報を検索していると、産業技術総合研究所の片岡先生が主催されているcvpaper.challenge が無料公開している国際AI学会の網羅的調査を見つけることが多いと思います。日本のAI研究を強くするために国際AI学会を日本語で網羅的にレビューするという野心的な計画の元、日本中のAI研究者がボランティアで参加して毎年運営されています。私もその活動に非常に感銘を受け、2021年から参加させていただいています。
片岡先生に教えてもらった「学会の網羅的調査」はそれ自体が大発明だと思います。私は医療AI研究をしているのですが、この活動から最新のAI技術を網羅的に学べたことが研究に大きく影響しています。特にCVPR・ECCV・ACLの知識は勉強になりました。ひとえに片岡先生とその仲間の先生のお陰だと思います。
そのお返しの意味も込めて北米放射線学会(RSNA:Radiological Society of North America)のAI関連の教育セッションの抄録を読んで、個人的に感じたまとめを作成したので開示します。
この内容はRSNAの抄録をまとめて感じた(かなり)個人的な印象なので、いかなる組織の公式の見解を示すものではありません。また抄録しか見ていないため、実際の発表内容とは異なっている可能性も高く、個人的見解と割り引いて聞いていただければと思います。
# RSNA・ AI教育セッションの半網羅的まとめ
70以上のAI教育セッションがありました。教育セッションでこれだけあるのはすごいことだと感じました。米国でも医療AI研究が盛り上がり続けているなという印象です。
従来との違いも感じました。それはキーワードの変化です。自動診断という言葉が減少し、ワークフロー改善、画像バイオマーカー(画像の数値化)というキーワードが増えたことです。
FDAのホームページ(fda.gov/medical-devices/software-medical-device-samd/artificial-intelligence-and-machine-learning-aiml-enabled-medical-devices)で確認してみると、FDAが認可した医療AI・機械学習アプリは170以上もあります。深層学習を用いた最初の医療AIアプリは2018年に認可されているので、深層学習アプリが市場に出てから4年間も経過しました。そのため今年のRSNAでは医療AIアプリの発売後性能評価が目玉になっている印象です。
# 経営的視点による性能評価(図1)
まず目についたのは経営視点による医療AIソフトの検証です。これは日本の学会ではあまりお目にかからない視点です。医療AIを導入したことでどのように投資資本効率が改善したかを概観し、病院へのAI導入戦略について述べています。
キーワードはワークフロー改善です。医療は国によって違いますが人件費率は50-70%と非常に高いです。そのため診療時間が短縮されると、つまりワークフローが改善されると経営効率は眼に見えて改善されます。AIによるワークフロー改善効果に注目した教育セッションが3つもあることが、その重要性を物語っています。
しかし経営解析には弱点があります。それは良い診療をしたとしても金銭的利益には反映されにくいため、経営解析からは患者さんにとって価値がある医療AIがわかりにくいことです。
# 臨床的視点による性能評価(図2)
そこで大事になってくるのが医療AIの臨床的な性能評価です。FDAに承認された医療AIを実際に臨床現場で使った結果から、どの医療AIが有用か、どのような性能が有用であるかの評価がなされています。その中で目を引いたのが画像バイオマーカーという考え方です。従来の診断型AIは画像から直接診断につなげようとしていました。肺のCT画像のここに癌を疑う像がある、下肢のCT画像のここに骨折を疑う像がある、といった感じです。
しかしそれ以外のAIもあります。皆さんが飲食店などの入り口で利用している体温測定AIです。AIは画像から直接推定体温を計算して表示してくれますが、その数値をどう判断するかは人に委ねられます。つまり数値評価と判断が分離しています。この方法の利点は画像の数値化性能と、数値の臨床的価値を分離することができる点です。
もう少し言えば、AIが内部的に利用している数字を外に出した方が、臨床的価値が高いということになると思います。画像バイオマーカーの考え方はワークフロー改善効果と並んで重要になってくると思います。
*コラム:二つの画像バイオマーカー
画像バイオマーカーの考え方は古くからあります。従来の考え方では、医療画像から得られる数値を標準化する意味合いが強いです。しかしAIの文脈ではAIの内部数値を外に出して利用する、あるいは人間が利用可能なAI内部の数値を探求するという意味合いが強いように感じました。同じ単語なのですが、どちらの目的で使うかで印象が大きく変わってくるので注意が必要です。個人的には後者の意味が今後強まってくると思います。結果的にAIによる数値化とAIによる判断を分離できるため、人間とAIの共存も見てくると思います。サーバーからクラウドという言葉が生まれたように、別の言葉が生まれる気がします。将来が楽しみな領域です。
# 疾患からみたAI評価(図3)
医療AIが増加したことで、各疾患においてどのように医療AIを利用するべきかというセッションが増加していました。ざっと調べただけでも12セッションあり、心臓や乳がん、肺疾患、整形外科などのホットな分野では2セッションありました。医療AIをどのように使うかではなく、各疾患領域でどのように医療AIを使うかというレベルまで進化していることが見て取れます。
また医療装置特性からみた医療AI開発についてのセッションもありました。これは非常に重要な視点です。なぜなら医療装置ごとに画像特性が大きく違うからです。特に超音波は他の画像装置とは全く異なる特性を持っています。そのため超音波(US)のセッションでは超音波の画像生成の仕組みから説明をしてました。このような画像特性をAI開発に反映することでさらなる性能向上が見込めると思います。
このように医療AIの各論が充実してきたのが、今年の特徴だと思います。
# AIの弱点・データ・倫理(図4・5)
AIの欠点についてのセッションもありました。AIは学習時のデータによって性能が決まってしまうため、AIの問題点をデータ由来のバイアス問題にからめて語るセッションがありました。またAIとデータの関係についてのセッションも非常に多く、データのサイズ・品質・不均質性、またモデルの妥当性についてのセッションもありました。
またAIの倫理的な問題、特にプライバシー管理をどうするか、セキュリティーについてのセッションもありました。ちょっと面白いところでは、患者から見たAIの価格透明性の取り組みという内容もありました。
AIの欠点をあげつらうのではなく、AIの欠点が何に起因しているか(データなのかモデルなのか)、そしてどのように改善したらいいかを検討しようという意気込みを感じました。
# AIハンズオン(図6)
AIを体験できるハンズオンも非常に盛んで、YOLOを用いた物体検出タスクだけでなく、GANを用いた画像生成のハンズオンもありました。胸部単純X線画像から自動的にレポートを作成する画像からの言語生成のハンズオンや自然画像処理のハンズオンなどのNLP関係のハンズオンがあったのは驚きです。さらにAmazon SageMakerを用いたDevOpsの体験やNASを用いたパラメーターの自動調整のハンズオンセッションまでありました。
クラス分類・物体検出・セグメンテーションなどの基本的なAI技術だけでなく、画像生成や言語処理(Vision and language も!)はてはDevOpsまでとものすごい内容になっています。
主な参加者が医師であるにもかかわらず、これほどAIハンズオンが充実しているのはさすが本場の米国だなと感じました。
# データセット(図7)
最後にデータセットのセッションを紹介します。なんといっても目玉商品は、35TB ものデータ量を誇る医療画像データセット:NCI Imaging data Commons (https://imaging.datacommons.cancer.gov)のセッションでしょう。様々な組織・モダリティーのデータが含まれており、ホームページから各種データに対するアクセスも容易で使いやすいため今後の発展が期待されます。
他にもTCIA データセットのセッションもあり、医療関係者がどうやって個人情報を除去して登録するかなども説明されています。
これらのデータセットには使用条件がありますが、医療画像領域におけるMNIST的な立ち位置を目指しているMedNISTは利用条件が簡単なので医療関係者以外にも使いやすいと思います。
# まとめ
以上、簡単ですが今年のRSNAのAI教育セッションの半網羅的まとめです。
医療AIの利点は自動診断だけでなく、ワークフロー改善による経営効率の改善と、画像の数値化(画像バイオマーカー)にあることが分かったことが今年の収穫です。
最後に、本内容は学会の抄録をまとめて感じた個人的感想であり(そもそも学会発表を見ていません)、いかなる組織の公式見解を示すものではないことを改めて示させていただきます。
2022/12/21 初稿
2022/12/25 コラム:二つのバイオマーカーを追記。各種間違い・表現の修正。
この記事が気に入ったらサポートをしてみませんか?