見出し画像

bunkoOCR

日本語の小説をOCR(光学文字認識)するには、ふりがなも一緒に認識したいです。
とある科学の超電磁砲レールガンとか

アプリの紹介

OCRするときにふりがなを削除して認識するソフトばっかりなので、一緒に認識できるように、新たに認識エンジンから作ってみました

よいところ

  • 日本語の文章の、縦書きでも横書きでも、ふりがな付きで(認識した上で削除することも可)出力できる

  • 一応、英語も読めるはず

ソースコード(認識エンジン)

iOS版bunkoOCR

Windows版bunkoOCR

どんな感じに認識するのか

手書きのテキスト

手書きのテキスト


手書きのテキストを文字認識したところ

印刷フォントのテキスト

フォントのテキスト
フォントのテキストを文字認識したところ

アプリの使用方法の動画

iPhoneにはカメラがついているので、適当なスマホフォルダーで浮かせて固定して、下で本を見開きにして撮影しながらOCRすることができます。

端末内の既存の画像からOCRすることも、もちろん可能です。

精度をアップさせた新バージョンのエンジンを開発中

まだまだ完璧とはいかないので、認識ミスするところを直した新バージョンを開発中です。
今のバージョンで上手くいかない画像の例があれば教えていただけると、次のバージョンでは認識するようにがんばります。

いいなと思ったら応援しよう!