縦書き自炊PDFのOCR・・・グーグルレンズを試してみる・・・画像のテキストを読み取って検索結果が表示・・・これGoogleそのもの・・・
たびたび自炊PDFのOCRを記事にしてきました。
「コテンと眠るために大きなフォントで読みたい・・・」とか、
「参考文献をまとめるために『LiquidText Pro』を効率よく使いたい・・・」
こんな目的で縦書き自炊PDFのOCRを追求してきました。
『Clip OCR』(サブスク)や『読取革命』(win)、『写真の翻訳』など・・・
また、アプリ付属のOCR・・『PDF element Pro』、『LiquidText Pro』、『MarginNote』・・・どれもこれも一長一短です。
最悪のケースは、日本語縦書きは右上から左へ行を繰っていきますが、左上から右に向かって行を繰っていく(たいてい外国製のアプリ)・・・もう、最悪!
さて、「googleレンズ」はいかに・・・
「googleレンズ」は「画像」をOCRしますから、せっかくの自炊PDFも「画像」に戻すことになります。自炊PDFを1ページづつスクリーンショットを撮るとかします。
・・・メンドクセェって人は『読取革命』でまとめてポイの一択【シランケド】
☆ android版と iOS版の違い・・・android版に軍配!
「googleレンズ」には、当然ですが、android版と iOS版があります。
android版は、「googleレンズ」アプリで、 iOS版は「googleアプリ」となります。
大きな違いは、一度に認識できる文章量です。
android版では読み込める量も、 iOS版では弾かれます。
iOS版では一枚のスクリーンショットを細切れにしてOCRをかけることなります。手間がかかりますが、こうすることによってルビも拾います。
ルビ付き部分OCRには最適です。【これまた・・・一長一短】
☆ ルビの読み込み位置の違い
ルビの表示位置は、本文に混じってきます。ルビが文末に集まって表示されるよりはいいかも【シランケド】
《感想》
ルビがここまであると、大混乱・・・【うん、ほんまやで】
☆ googleレンズの特徴 スクリーンショットを一枚づつ
『Clip OCR』や『写真の翻訳』などと同様、スクリーンショットを一枚づつ処理していくことになります。
しかし、最近のスクリーンショットが「最新」の順に表示され、その下に「すべての画像」(これも「最新」順)が表示されます。次々とOCRしていけます【うん、ほんまやで】
同じような『Clip OCR』や『写真の翻訳』の次から次へより、効率的です。
こんな感じでルビと本文混ざった結果・・・あいかわらずルビで苦労【うん、ほんまやで】
横書き・縦書き混在に挑戦!
「ここはどこに」とパズルのような状態・・・縦書き・横書き無難にこなす・・・やはり「横書き」が安定しています。
もっとも力を発揮した・・・縦書き・ルビなし部分OCR
《感想》
ルビなし、平易な現代文、さらに部分キャプチャーで文字が大きい場合は
とっても良い結果が引き出せます。
さらに、Googleらしく、この文章の場合は「町奉行」という検索結果がでてきます。
この文章の場合は「三奉行」というGoogle検索結果が出てきます。
認識できた文頭の言葉を選んでいるわけでなく(そうであれば「お家騒動」や「勘定奉行」を検索結果にしても良さそうですが、「三奉行」です。
オンラインAIのOCR・・・それも無料・・・
確かにiOS版では一度に認識する文字量が少ないので、画像を分割する手間がかかる・・・この手間をかければ「ルビ」も変換できます。
ページごとにOCRをかけたい時は、Android版を使えばいい・・・ただし、ルビが飛ぶのを覚悟して・・・
一長一短を活かして、『Clip OCR』のサブスクは1週間単位で設定できるので短期集中。『読取革命』は細かい範囲設定を活かしたいとき、ゆっくりのんびりOCRは『写真の翻訳』・・・部分OCRは「Googleレンズ」・・・・・
横書き自炊PDFなら『PDF element Pro』で一気にOCRをかけて『LiquidText Pro』へ持っていくか・・ダイレクトで『LiquidText Pro』ヌキ出したい文節だけOCRをかける・・・など一長一短を活かして臨機応変に対応・・・
最近よく使う参考文献がやたらルビが多いので・・・部分OCRは「Googleレンズ」・・・・・ということになりました【うん、ほんまやで】