![見出し画像](https://assets.st-note.com/production/uploads/images/130647977/rectangle_large_type_2_3d7d10490dd22414bf1adcf30666eae1.png?width=1200)
OCRの精度徹底比較
OCR対応のPDF編集ソフトを比較していきます。
OCRの精度比較
![](https://assets.st-note.com/img/1708080410057-z0oF6KTOku.png?width=1200)
簡単な概要とTwitterの口コミをまとめました。
PDFエレメントのOCR精度
![](https://assets.st-note.com/img/1708054680399-L6kw4LSEyj.png?width=1200)
人気なのはPDFエレメントです。
料金がリーズナブルなのに永久ライセンス。
OCR光学文字認識、OCRのバッチ処理。
プロ版は23の言語。
OCRの検索・編集、ePUBの出力、PDFの圧縮などにも対応。
動画編集ソフト、PC画面録画、マインドマップ、フローチャートソフトでも有名なワンダーシェアが開発・販売
他のソフトウェアと違って、PDFエレメントは体験版がでているのでまず試してみましょう。詳しくはこちらです。
では、口コミをみていきます。
PDFelementってヤツが安くてOCR認識からのエクセルエクスポートできるの結構使えるかも、0が〇になったり数字で,の前後に空白入るときあるけど、それは一瞬で置換できるしそれ以外は特に大きなずれも無く、文字や数字そのものは正確に読み取れてる。今まで手入力してたけど、これはデータ分析捗る。
— Fukui-san (@ftakao2007) June 10, 2023
経験値が浅くてOCRが邪魔になってしまうのは想像つかなかったです😲
— ノイジー (@Nm_noisy) February 23, 2023
あとAdobeは高いから手が出ないのでpdfelementで行こうかなと思います
PDF→Excelは画像はダメだと思っていたら今はOCRがあるのねえ。PDFelementは凄いな。
— Touch No Fret (@Touch_Fretless) July 22, 2022
悪評はないのでしょうか。昔はあまり有名ではありませんでした。改良を重ねて最近頭角にでてきた感じですかね。
PDF ELEMENT、6までは正直なんか微妙だなぁと思いつつも課金したしほかのフリーソフトと併用して使ってたけど、7になってなんか名前の変更とか他一括処理やらOCR処理もまぁまぁできるようになってpdf拡張子との紐付けをするぐらいメインソフトになった
— Is-m (@Is_m_) May 5, 2021
実際に使ってみましたので詳しい体験談をのせてあります。
読取革命のOCR精度
読取革命はパナソニックさん開発でした。今は販売だけではなく開発も含めてソースネクストに譲渡するようです。
読み取り革命は昔はすごく人気でしたが、新しいバージョンがなかなかでません。
読取革命Ver.15は2012年に販売されましたが、読取革命Ver.16は2020年で実に8年あきました。
日本語のOCRの精度は良い方と言われますが英文は弱いと聞きます。結構、英文が紛れている記事を扱う人は困るかもしれません。
縦書きにはよいらしいです。
Windowsのみです。
よい口コミもあるようです。
日本語OCRの精度がいいソフト探して読取革命買ってみたけど精度めちゃくちゃいいね
— minahoku (@minahoku) July 13, 2023
しかも間違えてるところはパターン辞書で学習させれるのが良い。使えば使うほど成長するみたいで
ただルビには弱いみたいでほとんど認識しないor誤認識するからそこだけ弱点
多分今年、読取革命を買います。
— ステラ (@stella3860) January 13, 2023
ネットをさまよった結果、
自炊本のための縦OCRは読取革命が一番よさそう…
最近、ScansnapHomeのOCRだと、i文庫HDでなぜか文字化けするので、読取革命16をここ数日試している。縦書きにも対応してだいぶ変換ミスも減って満足といえば満足なんだけど、領域分けや校正と細かく調整できるせいで、ついついOCR処理に時間を掛け過ぎてしまうのが難点だなぁ。
— ftoku (@ftoku) July 14, 2023
「ハ」が「(」になってたり、「エネルギー」が「干不ルギー」になったりと、変換ミスに癖があるので、全ページ一括置換機能あれば、かなり使い勝手良くなるんだけど…。販売元がPanasonicからソースネクストに変わってるところ思うに、今後大きな機能追加は期待薄かもしれん。
— ftoku (@ftoku) July 14, 2023
自炊したPDFにまともなOCRかけようと思って読取革命16買ってみたけど制度がイマイチだな…
— hakase329 (@hakase329) February 20, 2023
たぶん設定とか使い方が分かってないんだと思うけど結構ひどくて笑った
読取革命はパナソニックさん開発でした。今は販売だけではなく開発も含めてソースネクストに譲渡するようです。
読取革命の開発・販売・サポートはソースネクスト株式会社へ移管し、2020年10月7日に新バージョンを発売いただいております。
なお、「読取革命Ver.15」のサポートにつきましては、2022年3月31日をもって終了しました。後継製品のお問い合わせはソースネクスト株式会社へお願いいたします。
読み取り革命はAmazon以外に、ソースネクスト公式サイトのセールで安く買うことができます。
いきなりPDFのOCR精度
いきなりPDFは普通に使うぶんにはいいのですけど、OCRではあまりいい評判が見つかりませんね。
いきなり PDF for 自炊、OCR さえしなければ最強の自炊ツールかもしれない。OCR さえしなければ。
— Bojan (@bojan_intl) July 8, 2023
「いきなり PDF for 自炊」は OCR 結果の修正もできないし、何よりアルファベットが全角だったり半角だったりする致命的な問題があった。ただ実は OCR 枠の自動認識が割と優秀だったんだよね。
— Bojan (@bojan_intl) September 8, 2022
ソースネクストの「いきなりPDF」。
— アムネシア(個人) (@amnesia828) November 18, 2022
バージョンアップで 10 になったけれど、相変わらず、透明文字(OCRで作った文字)の編集が出来ない。
正確には、透明文字を編集すると、色が消せない。
「透明文字」に出来ない(戻せない)。なんでや!
取り寄せ論文をスキャナで取り込んだあとにいきなりPDFっていうのでOCR変換ってのを試してるんだけどだめっぽい。300dpiで取り込んでも英単語の最初の一文字目飛ばしがちだし、本文は文字が小さいのかeが8とかに認識されてしまう…みんなどうしてるの?論文を上で取り寄せる文化は他社では滅びてるの?
— 堂本まひろ (@mihilomi_ko) November 18, 2020
いきなりPDFはソースネクストの公式サイトで購入することもできます。
JustPDFのOCR精度
昔買ったことがありますが、商品は悪くないと思います。OCRできないやつだったので、OCR精度はわかりません。
OCR対応のPRO版は料金が高いです。
一太郎で有名なジャストシステムが開発。
Twitterの口コミを拾ってみました。
PDFの閲覧編集ソフトとしてAcrobatを愛用してるけど、OCRはJust PDFの圧勝。日本語を理解してくれている感がある。さすが一太郎の会社。
— Gongo31 (@Gongo31) February 3, 2024
Acrobarよりはいいのですね。悪評はないのでしょうか。
JUST PDF 5 [編集Pro] 複数ページの操作をしようとしたら死ぬほど時間がかかるもよう。どんだけ高機能なPCで開発してるのかな。岩波のPR誌『図書』をスキャンした 102ページ 30MB程度でこれでは…
— 望月正道 (@MasamichiMoz) August 9, 2022
JUST PDF 4 [高度編集] ならサクサク扱えるので(OCRのバグはあるけど)こっちを使い続けようかなあ
JUST PDF 5、水準外の漢字も OCR してくれるのは優秀なんだけど、レイアウトの解析はやっぱりダメダメで、e.Typist のように手で設定するのも不可能ではないにしても凄まじく操作性が悪いんだよなぁ。
— Bojan (@bojan_intl) October 27, 2022
Adobe AcrobatのOCR精度
対応言語数もグローバル企業らしく1番多いです。
料金はサブスクリプションになりますので、そこを許容できるか否かでしょうか。
AcrobatのOCR精度が低すぎるから使わないで欲しいんだよな
— きゅれー (@kyureru) December 21, 2023
AcrobatのOCR、縦書きでアルファベットはハチャメチャになりがち。
— sonodaya (@sonodaya) July 23, 2021
AcrobatのスキャンOCR。ひさしぶりに使ってみたら、精度が上がっていて驚いた。黄ばんだ本のかすれた文字もかなり正確に認識してくれる。
— YokoMotegi (@yokomotegi) November 25, 2023
ありがたい!
OCRの精度は賛否両論です。Adobe Creative Cloudプランに含まれるAcrobat DCはProでもOKです。
OCRの精度徹底比較!おすすめは!?
個人的にはたまにしか使わないためサブスクは避けたく、MacとWindowsの両方で使えるPDFエレメントがよいですかね。
縦書きでは読み取り革命も人気のようです。こちらにもまとめてあります。
ご参考になれば幸いです。