見出し画像

市販のスキャンが気に入らない(600文字)

書籍のスキャンを上手にしたくていろいろ試してみました。

ScanSnap

数年前に部屋の本を片付けたくてスキャナーを購入しました。

書籍のような大量の紙を読み込むのであればこのタイプのように。

複数枚セットでき、両面を読み込めるスキャナーを選ぶしかありません。

断裁機

スキャナーで読み込む際、本をバラバラにする必要があるのですが。

この作業を効率化するため断裁機を購入しました。

音声アプリと連動

ここでもう一つスキャンした本の使い方を見つけました。

AndroidアプリにReadEraというソフトがあります。

このソフトにPDFファイルを読み込ませると読み上げをしてくれます。

最初はコレでいいかと思っていたのですが。

読取革命

スキャナーに付いているソフトは識字率がちょっと悪いんです。

そこで、文字の読取りのためにPCソフトを購入してみました。

なかなか良くできたソフトで日本語の識字率が高い。

しかしながらそれでも、いくつか問題が分かってきました。

①上部のページ番号や題名まで読み込んでしまう
②1ページ内の行が少ないと読み込みに失敗する
③読み上げの際、1行ずつ一瞬止まる

Pythonで対応

そこで、問題部分をプログラミングで解決することにしました。

①の問題 ⇨画像にして上部を切り取ってしまう
②の問題 ⇨シャープネスを上げるとうまくいく
③の問題 ⇨元ファイルの改行を除く

で、できたファイルがこちら。

十分Audibleオーディブルの代わりになりそうです。


いいなと思ったら応援しよう!