【医師の幼稚園:医療AI編⑤「ワインとAIは同じ」
クリニックでの診療以外にMAPI(医療AI推進機構)の想いに賛同し活動に参加させていただいております。
(この記事も井手個人の見解として記述をしております)
先日の記事は「AIは破壊者?救世主?」という話題で書かせていただきました
ワインとAIは似ている?
「You are what you eat.」は、直訳すると「あなたはあなたが食べたものでできている」という意味になります。食事が体だけでなく心にも大きな影響を与えることを端的に表現した言葉です。自分を味わうわけにはいかないので自分について知ることはできません。
しかし、ワイン好きが多い医師の先生方にわかりやすいように ワインの例でかかせていただきます。 (私自身は全くワインについて知らないのでこのリンクの記事の受け売りになりますが申し訳ないです)
ワインを表現するときに使われる言葉「テロワール」。
「テロワール」はフランス語で、「土地」という意味のterre(フランス語)と、「領地」という意味のterreitorium(ラテン語)が語源と言われています。
土地の個性とは、以下のようにブドウ畑を取り巻くすべての自然環境のことを指しています。
・気候(日照時間・気温・降水量)
・土壌(地質・水はけ)
・地形(標高・斜面の向き)
特にフランスのブルゴーニュ地方の土壌は「パッチワーク」と表現されるくらい場所によって個性があり、隣の畑でも全く違う性質があります。
同じ品種を栽培しても、土壌が違えば全く違う味わいや品質のワインになることから、「テロワール」という言葉は、ワインを語る上で欠かすことのできないキーワードとして、世界中で使われています。
言い換えると
「Wine is what grapes eat.」ワインは葡萄が食べてきたもの、育ってきた環境で決まると言っても過言では無いかと。
同様に
「AI si what AI eats.」つまり「AIはAIが食べた(学習した)データによって決まる」です
なぜこんな話をしているの?
昨日読んだ雑誌で門外漢の私でも「へーっ!、ほーっ!」という医療AI情報が満載でそれを引用し、私見を交えながら書かせていただきます。
「医療AIの研究開発のためのデータプラットフォーム構築に向けて」というMAPI代表の島原氏の記事の中で
・「医療AIは深層学習技術を用いたものが多く、その技術自体がデータ駆動型であるため、データの重要性は言うまでもない。」
・「現場から質の高いデータを抽出し、提供する人材の育成やELSI(倫理的・法的・社会的課題)研究及び情報モラル教育の推進など、現場の医療データリテラシーの基礎を改善する活動の重要性も示されている。日本は医療データについて世界に遅れをとっている危機感から対策の必要性が求められている状況である。」
・「たとえば医用画像でよく使われるDICOMも規格が非常に柔軟で多様な実装が可能だが、そのために異なるベンダーの機器やシステム間でのの互換性が確保されない場合がある。ベンダーごとに独自の拡張や解釈行われるため、完全な相互運用が難しい。また、多くのオプションやプロファイルがあり、標準化規格といえども本規格を標準データとして扱うことが難しい」
・「さらに医療データは要配慮個人情報に該当し、その取り扱いは厳しく規制されており、取り扱うプロセスも煩雑である。特に医用画像データについては、匿名化や仮名加工の定義が曖昧な箇所もあり、医療データ提供側に適切な加工方法に関する不安が存在する。加えて、実際にデータ抽出されたのちの匿名化や仮名加工のプロセスが複雑で。時間がかかることが多く、専門的な知識や技術が必要である。」
・「このプロセスには、業務であらゆるリソースが逼迫している医療機関にとって、追加のリソースとコストを伴うが、それに見合う充分な経済的インセンティブが提供されていないため、医療機関は積極的にデータ提供を行わない傾向が。結果として、医療データんの収集が滞り、研究や開発に必要なデータが十分に集まらない現状がある。」
・「データ駆動型の研究開発においては、データ量が多ければ多いほど。しかし、診断支援AIの場合、適切な診断がなされてないデータを学習したAIは性能が低下する可能性がある。例えば、肺がんと診断された胸部単純エックス線写真を用いたAIを開発するを場合、そのデータが検診で指摘されたものなのか、確定診断がついたものかを明確に区別する必要がある。。実際には画像だけでなく、時系列の差分やその他の所見を総合的に判断するため多くの情報を整理して利用することが重要である。」
つまり、こういったため息から
「医療データの利活用が最大のボトルネックであると考え、世界最良のデータセンターの構築を目指している。特に医用画像データの整備を強みとし、診断情報だけでなく。時系列データやほかのレポート情報統合し、スケーラブルで検索性の高いデータプラットフォームを設計している。効率的なデータ収集可能するゲートウェイサーバーを開発し、院内で匿名仮名化を行い院外に安全に転送したのちに、検索性の高い状態で整理することで、必要な時にすぐにデータが抽出できる。AI実装を目指している。」
「さらに、医療AIの事業サイクルにおいて重要な法規制対応を含めたデータ関連以外にもワンストップサービスを提供し、あらゆる課題を解決することを目指している。また、2024年4月に施行された次世代医療基盤法の改正法に基づく。認定匿名加工医療情報作成事業者及び認定医療情報取り扱い受託事業者の認定取得を目指しており 医療機関が安心してデータ提供できる環境を整備することに注力している。具体的には、医療機関に寄り添い、データ提供方法を提案し、各医療機関に最適な方法を選択してもらうことで、データの収集を進めている。集められたデータはRobust性の高いAIや多様なAIの研究開発に使われるデータとして整理される。このようにしてMAPIは日本の医療データの利活用を進め、世界に遅れをとらないための対策を講じて行きたいと考えている。」
「MAPIでは無料データを提供いただく医療インセンティブがない状況では持続可能な成長が認めないと考えている。
データ提供の最大の理由である良いをAI利用するためにサーバー費用などをまかないデータ販売による対価を再分配することで、医療機関がデータを流通させるインセンティブを提供する。」
というのがMAPIの活動なのです
今日はここまで
(このシリーズの趣旨)まずは「へーっ!」だけでOK
「noteで新たなシリーズ【医師の幼稚園:医療AI編】を勝手に始めます!」
このシリーズの趣旨は以下の記事に書いております
内容は自分の興味のままに学習した医療AIに関することを備忘録的に、脈絡なく、系統立てずに書き残すシリーズです。ですので、話題は飛びまくりですしレベルが低いです!
しかし、自己紹介にも書かせていただいておりますが「①【医療・開業医のため息】をまず自分のために解決したい。」と、自分のために行っている活動ですので苦情は受け付けません(笑)
(再掲)とにかくAI試してみよう!
ChatGPTやCopilotやGeminiでは無料で試せるものがありますのでまずは触れてみてください。どのように触れるかはまた実例を後日書かせていただきます。
目的は一般のAIを使うことでメリットやデメリットや使い分けの理解がでてきて、医療AIでも結局そういったケアをしながら使うことでメリットが大きくなるので 悪くないんじゃないという先生方や医療機関が増えることが大切だと思うのです。
(再掲)AIと間接民主主義
これはMAPIのメンバーの言葉で感動したものです・
「データを提供していなければ、AIはその施設の特性を無視して判断するように、基準が作られていきます。学習データを提供することで、間接的に、自分たちの医療判断や患者層を基準に取り入れさせるという意味では、間接民主主義みたいだなと思いました。」
そういった意味でデータを提供してくださいということも大切ですが、AIを使ってダメさ加減にため息を感じていただくことでデータ提供が更に進むと思います