閑話三昧 #4 ~本を聴く
どうする自炊本
仕事をしていた頃は時間がないながらも、けっこう通勤電車の中で読書時間は確保できていた。定年後は通勤がなくなり、さらに視力の低下とともに読書量が減った。
「定年後にでも読もう」と買いためた書籍は、やがて生活の場を圧迫しはじめたので、自炊(※)しまくった結果、ダンボール何十箱ぶんもの本が小さな外付けハードディスクに納まった。
(※本を分解し、スキャンし、PDFなどに画像化すること。)
さて、定年をむかえてみると、昔はなんとか読めた文庫本も、眼病のせいもあり弱った目がまったく受けつけない。PDFビューアで多少拡大してみても、字がちらついて疲れる感じはかわらない。
一方、地域のオンライン図書館で借りる電子ブックには「リフロー型」といって、字を拡大するとページレイアウトも変わるタイプがあり、読みやすいのだが。
しかし読みたい本が「フィックス型」であるとそうはいかない。
拡大表示すると、縦一行読むために上下スクロールが必然なのだ。
つまり、膨大な自炊本はすべてこのフィックス型となる。
自家製オーディオブック
図書館の電子ブックには文章を読みあげてくれるものがある。
視覚障害のあるかたには貴重なサービスであろう。
これは、電子ブックの元が「テキスト」であればこそ読みあげも可能である。一方、スキャンした自炊本は「画像」なので、現状ではPDFを直接的に読みあげることはむずかしい。
では、なぜ人間にはそれができるのだろう。
・画像から文字を抽出・認識し
・文脈から文節を解析し
・音声化する
からである。
個々の作業は現在の技術でできていることばかりである。
だから、AIが画像PDFなどを読みあげることは、すぐにできるようになるだろう。そうすれば、自炊本も有効活用できる(はずだ)。
なお、私自身の自炊作業はけっこう昔のことなので、現在ではもっと進んだやりかたがあるのかも知れない。ただし、元の本は処分してしまったため手持ちの自炊本=PDF資産の活用を考えねばならない。
私は一冊の自炊本で、上記3段階を手作業でやってみた。
・OCRソフトを使ってPDFをテキストに変換・修正
・読み間違いが少なくなるように、文字表記や句読点位置を変更
・読みあげソフトで音声化
こうして自前のオーディオブックをなんとか完成させたのだが、けっこう手間なので残りのぶんの作業はせずに、できれば画像PDFを読みあげてくれるようなAIの進化を待ちたい。
さて完成作を聞いてみる。
ネット記事閲覧など他の作業をしながらの「ながら聞き」では、本の内容がまったく頭に入ってこない・・(無理もないか。)
集中して聞く体勢も必要だが、いまさらながら、読書において目からはいる情報量の多さに気づいたしだいである。日本語には同音異義語が多すぎる。
やはり目は大切にしよう。
補足: 機械音声による読み聞かせは、眠くなってすぐ寝落ちする。寝酒効果あり?