見出し画像

iPhoneカメラで連続OCR

これの続編。

iPhone本体のカメラで連射→OCR→メモ帳書き込み→Teamsチャット が自動で出来る訳だけど伏兵があった。
例えばこんな感じの微妙に文字間が空いた数字列のOCR。


 伝 票 No

0 1 2 3 4 5 6 7 8 9


これを読もうとすると、何故か「1234」とかになってしまう。
色々と試して、"文字間が空きすぎている"のと、上に有る"伝票No"の文字に引きづられているのが分かる。透明なクリアファイルにマジックで線を引いて中に伝票を入れる。こんな風にするときちんと認識してくれる。
理由は分からないが、動いてくれればそれでいい。

 伝 票 No

0-1 2-3 4 5 6-7 8 9


文字の整形は生成AIにやってもらえばいい。

いいなと思ったら応援しよう!