
市販のスキャンが気に入らない(600文字)
書籍のスキャンを上手にしたくていろいろ試してみました。
ScanSnap
数年前に部屋の本を片付けたくてスキャナーを購入しました。
書籍のような大量の紙を読み込むのであればこのタイプのように。

複数枚セットでき、両面を読み込めるスキャナーを選ぶしかありません。
断裁機
スキャナーで読み込む際、本をバラバラにする必要があるのですが。
この作業を効率化するため断裁機を購入しました。
音声アプリと連動
ここでもう一つスキャンした本の使い方を見つけました。
AndroidアプリにReadEraというソフトがあります。
このソフトにPDFファイルを読み込ませると読み上げをしてくれます。
最初はコレでいいかと思っていたのですが。
読取革命
スキャナーに付いているソフトは識字率がちょっと悪いんです。
そこで、文字の読取りのためにPCソフトを購入してみました。
なかなか良くできたソフトで日本語の識字率が高い。

しかしながらそれでも、いくつか問題が分かってきました。
①上部のページ番号や題名まで読み込んでしまう
②1ページ内の行が少ないと読み込みに失敗する
③読み上げの際、1行ずつ一瞬止まる
Pythonで対応
そこで、問題部分をプログラミングで解決することにしました。
①の問題 ⇨画像にして上部を切り取ってしまう
②の問題 ⇨シャープネスを上げるとうまくいく
③の問題 ⇨元ファイルの改行を除く
で、できたファイルがこちら。

十分Audibleの代わりになりそうです。