【NYAUWとMAPIのクロスミッション】⑥「OCR機能」(実践編)
クリニックでの診療以外にMAPI(医療AI推進機構)の想いに賛同し活動に参加させていただいております。
(この記事も井手個人の見解として記述をしております)
先日は
一見【デジタル】のように見えるために期待値が上がってしまうが、実は【アナログ】で複製・編集が困難な【偽デジタル】について書きました
偽デジタルの具体例
院長先生方にとって身近な代表例(井手個人の’ため息’基準ですが)として名刺、キャプチャ画像、頂く紹介状などです。それぞれどんなため息でしょうか?
・名刺:せっかくオンラインなどのデジタルツールで作成したのに、紙(アナログ)としてやり取りが行われる。それを使ってコミュニケーションを行うのはメールやSNSというデジタルで行われる。その際のアカウント入力はマニュアルという偽デジタルのストレスがあります。特に私のような老眼世代はメールアドレスが見えなくて、お礼のメールを送るのを躊躇してしまうことも正直あります(すみません)
・キャプチャ画像:気になったWEB記事の内容を画面キャプチャでデジタル画像形式で保存した場合、その内容は画像の中なのでテキスト抽出できないという偽デジタルのストレスがあります
・頂く紹介状:せっかく電子カルテや文書作成アプリで作られているのに、クリニックには紙で印刷されて封書でやってきます。その内容をクリニックでまた手打ちで入力しなおすという恐ろしいことが行わています。 典型的な偽デジタルですね。
実際に試してみましょう!
OCR目的で使用しているもの
私がOCR機能の目的でよく使っているスマホアプリです。
注意)ここでも「なるほどなー」で終わらないでくださいね(笑)。スマホやPCで無料(または適価)で使えるOCRサービスを紹介しており、AIについてメリットとデメリットを実感してもらうことが目的ですので。
頻用している【Gemini】【ChatGPT】【Copilot】はスマホだけでなくPCでも使えます
この記事の画面の一部の写真をそれぞれのAI OCRにかけてみました
【Gemini】私はGoogle Oneの有料プランに契約してGemini Advancedを使用していますが、無料版でも写真のOCRができます
*Google Oneは2TBのストレージ容量もついており良いですよ
OCRの結果は完璧です
コピーや共有もしやすいです
【ChatGPT】これは以前は有料課金しておりましたが、下に紹介するCopilotに課金しているので、現在は無料で利用しております。
OCRの結果は完璧ですしこれもコピーや共有がしやすいです
【Copilot】これは実質ChatGPTです。ChatGPTと同じ課金価格ですが、OFFICEとの連携もしやすいのでCopilot Proに課金しています
https://www.microsoft.com/ja-jp/store/b/copilotpro
OCRの結果は完璧ですが、二次利用する際のコピーがしにくい形式になっておりますので使いにくいですね
*【Googleレンズ】撮影するとテキスト部分がハイライトされますが OCR結果はコピーしてペーストするまでわからないのであまり使っておりません。一番使うのはQRコードをスキャンするときですね。
*【Office Lens】これは以前には重宝していましたが最近はGEMINI、ChatGPT,Copilotの正確性には勝てないので放置状態です。
*【Perplexity】はProのプランのみ写真のOCRができますので今回は出来るだけ無料でできるものを紹介しますので割愛します。でもこれも普段使いの検索良いですよ
TPPI
これら上記のツールは確かに便利です。しかし、日々の忙しい診療中にやる人はほぼいないと思います(名刺や勉強目的では良いですが)
いつも意識することが「THEORETICALLY POSSIBLE、BUT PRACTICALLY IMPOSSIBLE(TPPI)の解決です」
・オリンピック選手に競技を選べばなれますが、なろうとする人は殆どいないですよね?
・宝くじも理屈上買い占めれば必ず当たりますが買い占めませんよね(期待値上平均すると胴元には負けるので)
診療中に紹介状をスキャンするまではMUSTなのでやると思いますがそれをわざわざアプリやサービスにUPLOADすることを期待するのは現実的ではないと思います。
診察中のカルテの画面の中で表示して、それをマウスで範囲指定すればその中のテキストをOCR出来るようなものくらいしか使えないと思うのです。
以下の記事でも書かせてもらいましたが
ここで注意しなくてはならないのは 紹介状という機微に触れる情報なので、OCR機能を利用するのにデータをアプリのサーバーに上げたりされないことが第一条件です。 フリーソフトなどではその説明がないことが多かったのですが いろいろ調べると
ABBYY FineReader EngineがOFFLINEに対応したOCRエンジンでそれを採用した適価なものを探すとありました。
いつもなら無料アプリをつかうのですが 紹介状を扱うので有料でOFFLINEで使えるものを使っています(瞬間テキスト2)
*しかし、今は新しいバージョンが販売されております(瞬間テキスト3 1980円)
https://www.sourcenext.com/product/0000014689/
それでも無料が良い!という方はGeminiやChatGPTをご利用ください
(WINDOWSのPOWER TOYSにあるText Extractorも試しましたが
この記事にもあるように変なスペースが入ったり クリップボードに自動で保存されますがペーストするまでOCR結果がわからないので、TPPIの解決という意味では 適価である瞬間テキストは悪くないかと思います。
今日はここまで
どうです?GeminiやChatGPT良いでしょ?
(再掲)とにかく試してみよう!
ChatGPTやCopilotやGeminiでは無料で試せるものがありますのでまずは触れてみてください。
目的は一般のAIを使うことでメリットやデメリットや使い分けの理解が出来て、医療AIでも結局そういったケアをしながら使うことでメリットが大きくなり、悪くないんじゃないという理解をされる先生方や医療機関が増えることが大切だと思うのです。
(再掲)AIと間接民主主義
これはMAPIのメンバーの言葉で感動したものです・
「データを提供していなければ、AIはその施設の特性を無視して判断するように、基準が作られていきます。学習データを提供することで、間接的に、自分たちの医療判断や患者層を基準に取り入れさせるという意味では、間接民主主義みたいだなと思いました。」
そういった意味でデータを提供してくださいということも大切ですが、AIを使ってダメさ加減にため息を感じていただくことでデータ提供が更に進むと思います
(再掲)このシリーズの目的は?
医療以外の日常でAIに触れることで、医療AIのデータ流通や医療機関へのAI導入が増え、患者さんケアの向上、医療従事者への負担減少、社会保障の負担軽減、医療レベルの上昇などにつながるというマクロ視点でのミッションと考えます。