オートロンさんに交通系ICカードの履歴印字をOCRしてもらった



もう一度オートロンさんに託す

本年春(2024年4月)以降、オートロンさん(autoron.ai)に同じ課題を振ったが、
上記の二者と似たり寄ったりの精度で出力してくれた。

なので当方界隈では実用化に至らず、
また記事としても投稿しなかった。

それで今回「もう一度」なのである。

作業の準備

今回、準備した画像は、以前にOCRの対象にしたのと同じ画像である。

いつもの難題。

某交通系ICカードの履歴の印刷物を撮影した画像である。

▲ まずは未加工の画像で


アシスタントの設定について

既存の「メモ整理」という役割のAIアシスタント。

とくに当方から設定を変更することもなく、
また、データの予習もさせなかった。

※ 今春にこっそり試したときと同じ条件です。

プロンプトとその回答

プロンプト-OCR依頼

この画像から文字列を抽出してテキストデータで出力してください

※ 本年7月に追加されたClaude3.5 Sonnetを利用した。
(以前に試したときはClaude3 Sonnetだった)

※ プロンプトも以前は、
「この画像内から文字列を抽出してください」だったのを、今回は改良した。

一次回答


画像生成中...10-20秒お待ちいただくことがあります。
画面は開いたままでお待ちください。

※ この後、20秒以上待機したが、画面は一切、変化しなかった。

追加プロンプト-ちょっと様子を伺うチャット

やっぱり難しいですか

※ このほか、
「どうでしょう」
「いかがですか」
「いかがでしょうか」
というプロンプト(チャット)でも可。

二次回答-渾身のOCR

申し訳ありません。画像を確認できました。ICカードの利用履歴が記載されているレシートですね 🚉 内容を抽出してテキストデータで記載します。

カード番号: JE**********0530

月日種別 利用駅 種別 利用駅 残額
1021入 地錦糸町 出 江戸川橋 ***28
1021現金 江戸川橋 **228
1021入 江戸川橋 出 地 清澄 ***29
1022現金 都 両国 **329
1022入 都 両国 出 都六本木 ***37
1022現金 都六本木 **357
1022入 都六本木 出 森下 ***35
1108現金 湯島 **235
1108入 湯島 出 地白金台 ***61
1108現金 江戸川橋 **201
1108入 江戸川橋 出 地錦糸町 ****7
1123現金 三越前 **187
1123入 三越前 出 地 住吉 ***19

2022.11.24 07:51
錦糸町 駅106発行

ご利用ありがとうございます。
(5/5)
JR東日本

これが画像から抽出したテキストデータになります。


数ヶ月で著しい進化

すげースゲーSugueee!!

オートロンよ、謝ることはない!
よくできました!

余は満足ぢゃ😊

履歴印字によっては、
文字や数字を誤認識したり、
一行まるまる認識しなかったり、
なんてこともあるが、
それくらいなら、人間でもよくやることだ。

もしかしたら不慣れな人間がやるよりも、間違う頻度は少ないかもしれない。

当方が目視で確認して修正すれば済むので、
大したことはない。

なおOCRを依頼した履歴印字画像は、合計5枚(実務用の画像のみ)。

費用は、オートロンのチャットで消費したのと、
カフェ利用料(wi-fiと電源と座席と飲食)で、
合計452円かな。

時間は計ってないけど、
まぁ、待機したり修正したりを含めても、
すぐに終わっちゃいましたね。

#入江さんありがとう
#オートロン
#Autoron
#難関画像もあっさり克服
#これで手入力が省けた

いいなと思ったら応援しよう!

KIXAN (the SHYNAMITES)
当方はク◯エイターです🤗 さて◯の中に入るのは何でせう? 「リ」だと思ったらサポート宜しくです(少額支援歓迎)☺️ 「ソ」だと思ったら即、退場せよ🥺 ※1: 記事のシェア歓迎。 ※2: 只今100円玉と壱萬圓札が不足しております🙏