AI-OCR Yomitoku を動かしてみる
日本語に特化したAI-OCRが公開されたので、触ってみようと思いました。
ただ、今使用している環境がだいぶ古い環境なので、動くかどうかはわかりませんが、やってみようと思います。
推奨環境は以下のとおり
CUDA 11.8以上
GPU VRAM 8GB以上
一方自分の環境は、
CPU:3930K
Mem:32GB
GPU:VRAM 6GB
VRAMが少ないのですが、動くかな~
グラボをのドライバを最新にし、CUDA Toolkit Archiveより、12.4.0をインストールしました。
![](https://assets.st-note.com/img/1732713328-oUyHf94LsWNrzTV1IM6ZjwKk.png?width=1200)
cudnnもインストール 9.5.1.17を使いました。
記事よりデフォルトで12.4対応のyomitokuがインストールされるとのこと
py -m pip install yomitoku
![](https://assets.st-note.com/img/1732714357-b0xp2igBPJ59hSX4ka3L8tYE.png?width=1200)
![](https://assets.st-note.com/img/1732714479-n6bUDPikujhpgBEH0lINxTYw.png?width=1200)
conclift?(´・ω・`)と思ったら、pytorchそのものが入っていなかった。
しかしながら、torchもインストールできない。
![](https://assets.st-note.com/img/1732714926-OFVQlkmAc6r1sh5ayW38ELYT.png?width=1200)
バージョンを3.9.xに戻したら動きました。
この検証前に3.7.xだったのをpipのバージョンアップするために13に上げたのが失敗。
![](https://assets.st-note.com/img/1732717021-2l9SawXDWImZz3rkxioOqeyu.png?width=1200)
![](https://assets.st-note.com/img/1732717287-IoPdWsT0wxiLAgp6RHOSF9lV.png?width=1200)
インストールできた!ついにyomitokuをインストール!
py -m pip install yomitoku
![](https://assets.st-note.com/img/1732717759-olP1LIbyTZVFaG9RuY4Owd7f.png?width=1200)
できた!
テストで動かしてみるために、ネット上に転がっていた適当な画像を使いました。
![](https://assets.st-note.com/img/1732720237-SGcNgzluRJLd4aPybmH7OX3T.png?width=1200)
開発者さんのとおりに実行!
py -m yomitoku "R:\tegaki1.png" -f md -o results -v --figure
…とVSCode上で実行するとエラーが出るので、いったんexeから実行しました。
C:\Users\ower\AppData\Local\Programs\Python\Python39\Scripts>yomitoku.exe "R:\tegaki1.png" -f md -o results -v --figure
お!?resultsフォルダができてる!
![](https://assets.st-note.com/img/1732720374-gHnhRA58IWTvymwSGzMY0OD4.png)
![](https://assets.st-note.com/img/1732720403-xIk1hp2vHNL5mjn4yU7AeXDW.jpg?width=1200)
![](https://assets.st-note.com/img/1732720423-psMzuLSN87AGOQqgVtXxlIdb.jpg?width=1200)
おおー!動いてる!
VRAM6GBでもそんなに遅くありませんでした。1分も待たなかった。
とりあえず動作確認できたので、今日はここまで。