人気の記事一覧

日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました

YomiToku で漫画のOCRを試す

2か月前

iPhone メモ&カメラ便利機能

基盤モデルなどを使いながら、文章をOCRするメモ

3か月前

市販のスキャンが気に入らない(600文字)

4週間前

AIで図解の添削! ~ChatGPT-4o アップデートの効果!? 図から日本語を読み取ってくれる!~

【論文瞬読】OCRの新時代:OCRBench v2で見えてきた言語モデルの実力と課題

3週間前

ドキュメント画像RAGのための検索機能をJDocQAを使って比較(ColQwen2、Jina CLIP v2、OCR+テキスト埋め込み)

2か月前

PDFや手書き文字を簡単にテキスト化!無料OCRツール&サイトまとめ

1か月前

YomiTokuアップデート情報 v0.7.1

yomitokuでOCRを試してみた

bunkoOCR

2か月前

AI2AIの世界観——AIがAIを進化させる未来

8日前

変態2画面タブレット OKPad が届いた!

2か月前

Kindle本を爆速でテキスト化してNotebookLMで使う方法(Mac限定)

¥1,500
8か月前

国会図書館デジタルコレクションをOCRする

2か月前

OCR導入のビジネスインパクト——10倍の生産性を目指して

8日前

漫画OCRでうっすらとした記憶を見つけたい

2か月前

OKPad縦書きを試す

2か月前

bunkoOCR操作手引き

2か月前

GeminiサイドパネルでPDF をOCRして表形式で出力をやってみた

Kindleから文字を抜き出して、NotebookLMで読む(Windows)

3週間前

iPhoneカメラで連続OCR

2か月前

bunkoOCRに愛を込めて ʕʘ‿ʘʔ

2か月前

AWS Lambdaを用いたサーバレス開発の事例

断ナシ自炊PDFの進化型に挑戦! 『タブレット スタンド タブレット アーム』+iPadで 擬似ドキュメントスキャナーを実現

Qwen2-VLを試して化学実験系の専門データを解読してみるメモ

4か月前

『Battle Brothers』日本語化MODと『WindowTranslator』を併用しchatGPTなどの生成AIを用いた高精度な翻訳手法まとめ(Windowモードのゲームなら非unity製ゲームでも日本語化出来るぞ兄弟!)

【秒速】一瞬でOCRするショートカットを作る方法

3か月前

PDFをMarkdownにしてからNotebookLMに読んでもらったら想像より良かった

2か月前

2025年6月期第1四半期 決算発表まとめ

BricsCAD や AutoCAD でお手軽に文字認識(OCR)する

¥0〜
割引あり

【PowerShell】Windows標準機能のみを使ってOCR実行

名刺画像をアップするだけでシートに自動転記する仕組みづくり!

PDFのOCR処理に革命!? Document Intelligence v4.0 で誰でも簡単にデータ抽出!

GPT-4oは画像の座標情報を理解しているのか?

小型マルチモーダルAI「MiniCPM-V」とは?GPT-4Vを凌駕する性能と活用法

5か月前

OCR YomiToku

写真から文字起こしするOCRアプリを4つ比較!長文取り込みはこれがベスト2024【使い方解説】

戸籍収集事務を大幅に削減する! OCRで相関図を自動作成、不足戸籍を“見える化”。相続財産管理システム「AI相続ミツローくん」(EAJグループ、サムポローニア)

外来でAI音声文字起こし①「電子カルテで楽になったからこそ、さらにさらに」

3か月前

大学入試共通試験「情報I]をAIに解かせてみた。

生成AIとAzure OCRを組み合わせれば、人間と同じレベルの文字読み取り率な件

【Ollama】誰でも簡単にローカルLLMを呼び出せるオープンソースで画像認識してみた

PDFから文字だけを消すプログラム(ソースコード公開)

音源なしの英語教材で「簡単に」音源を作成して音読練習したい。

1か月前

理想の電子書籍を語ってみる②

2か月前

書類をスキャンして作成したPDFの文字検索をできるようにする:Acrobat活用術

6か月前

スキャンしたPDFを生き返らせる!OCRmyPDFの魅力に迫る

11日前