オートロンさんに交通系ICカードの履歴印字をOCRしてもらった
もう一度オートロンさんに託す
本年春(2024年4月)以降、オートロンさん(autoron.ai)に同じ課題を振ったが、
上記の二者と似たり寄ったりの精度で出力してくれた。
なので当方界隈では実用化に至らず、
また記事としても投稿しなかった。
それで今回「もう一度」なのである。
作業の準備
今回、準備した画像は、以前にOCRの対象にしたのと同じ画像である。
いつもの難題。
某交通系ICカードの履歴の印刷物を撮影した画像である。
アシスタントの設定について
既存の「メモ整理」という役割のAIアシスタント。
とくに当方から設定を変更することもなく、
また、データの予習もさせなかった。
※ 今春にこっそり試したときと同じ条件です。
プロンプトとその回答
プロンプト-OCR依頼
この画像から文字列を抽出してテキストデータで出力してください
※ 本年7月に追加されたClaude3.5 Sonnetを利用した。
(以前に試したときはClaude3 Sonnetだった)
※ プロンプトも以前は、
「この画像内から文字列を抽出してください」だったのを、今回は改良した。
一次回答
画像生成中...10-20秒お待ちいただくことがあります。
画面は開いたままでお待ちください。
※ この後、20秒以上待機したが、画面は一切、変化しなかった。
追加プロンプト-ちょっと様子を伺うチャット
やっぱり難しいですか
※ このほか、
「どうでしょう」
「いかがですか」
「いかがでしょうか」
というプロンプト(チャット)でも可。
二次回答-渾身のOCR
申し訳ありません。画像を確認できました。ICカードの利用履歴が記載されているレシートですね 🚉 内容を抽出してテキストデータで記載します。
カード番号: JE**********0530
月日種別 利用駅 種別 利用駅 残額
1021入 地錦糸町 出 江戸川橋 ***28
1021現金 江戸川橋 **228
1021入 江戸川橋 出 地 清澄 ***29
1022現金 都 両国 **329
1022入 都 両国 出 都六本木 ***37
1022現金 都六本木 **357
1022入 都六本木 出 森下 ***35
1108現金 湯島 **235
1108入 湯島 出 地白金台 ***61
1108現金 江戸川橋 **201
1108入 江戸川橋 出 地錦糸町 ****7
1123現金 三越前 **187
1123入 三越前 出 地 住吉 ***19
2022.11.24 07:51
錦糸町 駅106発行
ご利用ありがとうございます。
(5/5)
JR東日本
これが画像から抽出したテキストデータになります。
数ヶ月で著しい進化
すげースゲーSugueee!!
オートロンよ、謝ることはない!
よくできました!
余は満足ぢゃ😊
履歴印字によっては、
文字や数字を誤認識したり、
一行まるまる認識しなかったり、
なんてこともあるが、
それくらいなら、人間でもよくやることだ。
もしかしたら不慣れな人間がやるよりも、間違う頻度は少ないかもしれない。
当方が目視で確認して修正すれば済むので、
大したことはない。
なおOCRを依頼した履歴印字画像は、合計5枚(実務用の画像のみ)。
費用は、オートロンのチャットで消費したのと、
カフェ利用料(wi-fiと電源と座席と飲食)で、
合計452円かな。
時間は計ってないけど、
まぁ、待機したり修正したりを含めても、
すぐに終わっちゃいましたね。