書籍の電子化(自炊) 準備編
自炊についての記事を書いていこうと思います。
ざっくりといえば自分がどうやって自炊しているか、そういうことです。
準備するものから順に紹介していこうと思います
まず一応確認ですが、自炊とはなんぞやということですね
Wikipediaさんによりますと
自炊
電子書籍に関する自炊(じすい)とは、自ら所有する書籍や雑誌を イメージスキャナ等を使ってデジタルデータに変換する行為(デジタイズ)を指す俗語[1]。デジタル化(スキャン)の効率化のために、書籍や雑誌を裁断機やホットプレート、アイロン等で分解する行為までを含む。もともとはP2Pソフトウェアで不特定多数に配布(著作物の場合は、当然著作権侵害となる)目的で書籍を自身でスキャニングするというネットスラングだった。
ということらしいですね。
簡単にいえば本をデータ化しようってことです。
このブログ見る人はだいたい医学生だと思いますが、医学書って厚くて重いですよね。
だから、こういうデータ化する波が来ているんだと思います。
見る端末もかなりスペックがよくなりましたからね。まぁmedu4の台頭も大きいか。
これから学生生活を始める諸君もこれから臨床医学の勉強を始める諸君もそうでない人も、今後めっちゃ本を読まなければならない身として、できるだけ持ち運びを簡単にすることを考えてみてはどうでしょうか。
ということで準備編
必要なものをまず列挙しましょう
1.PC
2.OCRソフト
3.スキャナー
4.裁断機
5.見れる端末(ipad的な)
1と5はデータである以上必要だってことはわかると思うし、だいたいPCは持っていると思うので割愛します。
それ以外について自分が使っているもの踏まえながら紹介していきましょう
OCRソフト
確実に必須のなのはAdobe acrobat DCですね。standardで問題ありません
他のOCRでは代替不可能な「PDFの最適化」というファイルサイズの圧縮がこれじゃないとできないので、確実に用意する必要があります
ただ、悲しいことに買い切り版がもうほぼネットで販売していないようです...
基本的に年間契約といった形になる模様。
これを高いと見るか、安いと見るか... ここ超えれば自炊の道は開かれます
ちなみに、ネットにはOCRではまで代行してくれるサイトもあるようですが、法律的にはグレーなようなので、OCRに関しては必ず自分でやるようにお願いいたします。
自分はこのadobe acrobatの買い切り版と、それの他に読取革命と呼ばれる別のOCRソフトも持っています
自分はなんとなくこの読取革命のほうが日本語のOCR精度が高いような気がしているので、こちらでOCRをかけてからAdobeでPDFの処理をしています。
なんで2つ持っているかといいますと、読取革命を先に買ったあとでAdobeの圧縮機能とPDFの編集機能を使いたくなったからです。
特に深い意味はありません
普通の人はAdobeだけで十分です。ただ、一応それぞれがどんな感じの精度なのか、この記事の最後で試していますので確認してみてください。
裁断機
本を切るアイテム。
裁断機についてはこちらを購入しました。
医学書裁断するならこいつしかないと思っています。
理由はただ一つ。裁断できる本の厚みがほかより上。
医学書は基本的に厚い本がいっぱいありますから、少しでも負担を減らすためにもできるだけ厚い本に対応した裁断機を買うことをすすめます
(ただ、そこまで厚い本が切れるわけではありません。病気がみえる 免疫の第2版を最近裁断しましたが、入りませんでした。そういうときは本を分割してから裁断します。詳しくは後で)
あとこれ縦置きできます。狭い部屋には最適です。ぜひご検討を
スキャナー
本をデータ化するアイテムですね。
自分が使っているのはこちら
最初調べたとき有名なのはこれって話だったのでこれ買いました。
基本的に今後自炊の説明するときはscansnapの設定でいきますので、うちの見ながらやるなら、scansnapという話ですが、自分で対応できるよーって話なら他のスキャナでもいいと思います
こちらのサイトでいろいろ比較されているようなので参考にしてみてください。
ちなみに、スキャナってどんくらいのスピードなんやって何も知らない方は思う気がしますので、以下動画がありますのでみてみてください
この一枚の紙が排出される段階で両面データ化されています。くっそ早い。最初は驚きました。
とりあえず以上ですね。あと本を分割するときにカッターが必要だったりしますが、オルファのカッター買っとけば何でもいいと思います。というか100均でも多分大丈夫。
揃えるとだいたい10万弱ぐらいになりますね...
これを高いとみたらそこまでですが、10万の投資で確実に世界が変わります。
ぜひ医学生なら買ってください。自分はそう思いますね。
では、次記事で裁断、スキャンと行きましょう。