閑話三昧　＃４　～本を聴く

2023年10月14日 14:18

どうする自炊本

仕事をしていた頃は時間がないながらも、けっこう通勤電車の中で読書時間は確保できていた。定年後は通勤がなくなり、さらに視力の低下とともに読書量が減った。

「定年後にでも読もう」と買いためた書籍は、やがて生活の場を圧迫しはじめたので、自炊(※)しまくった結果、ダンボール何十箱ぶんもの本が小さな外付けハードディスクに納まった。
（※本を分解し、スキャンし、PDFなどに画像化すること。）

さて、定年をむかえてみると、昔はなんとか読めた文庫本も、眼病のせいもあり弱った目がまったく受けつけない。PDFビューアで多少拡大してみても、字がちらついて疲れる感じはかわらない。

一方、地域のオンライン図書館で借りる電子ブックには「リフロー型」といって、字を拡大するとページレイアウトも変わるタイプがあり、読みやすいのだが。

しかし読みたい本が「フィックス型」であるとそうはいかない。
拡大表示すると、縦一行読むために上下スクロールが必然なのだ。
つまり、膨大な自炊本はすべてこのフィックス型となる。

図書館の電子ブックには文章を読みあげてくれるものがある。
視覚障害のあるかたには貴重なサービスであろう。

これは、電子ブックの元が「テキスト」であればこそ読みあげも可能である。一方、スキャンした自炊本は「画像」なので、現状ではPDFを直接的に読みあげることはむずかしい。

では、なぜ人間にはそれができるのだろう。
・画像から文字を抽出・認識し
・文脈から文節を解析し
・音声化する
からである。

個々の作業は現在の技術でできていることばかりである。
だから、AIが画像PDFなどを読みあげることは、すぐにできるようになるだろう。そうすれば、自炊本も有効活用できる（はずだ）。

なお、私自身の自炊作業はけっこう昔のことなので、現在ではもっと進んだやりかたがあるのかも知れない。ただし、元の本は処分してしまったため手持ちの自炊本＝PDF資産の活用を考えねばならない。

私は一冊の自炊本で、上記３段階を手作業でやってみた。
・OCRソフトを使ってPDFをテキストに変換・修正
・読み間違いが少なくなるように、文字表記や句読点位置を変更
・読みあげソフトで音声化

こうして自前のオーディオブックをなんとか完成させたのだが、けっこう手間なので残りのぶんの作業はせずに、できれば画像PDFを読みあげてくれるようなAIの進化を待ちたい。

さて完成作を聞いてみる。
ネット記事閲覧など他の作業をしながらの「ながら聞き」では、本の内容がまったく頭に入ってこない・・（無理もないか。）

集中して聞く体勢も必要だが、いまさらながら、読書において目からはいる情報量の多さに気づいたしだいである。日本語には同音異義語が多すぎる。
やはり目は大切にしよう。

補足：　機械音声による読み聞かせは、眠くなってすぐ寝落ちする。寝酒効果あり？