人気の記事一覧

日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました

YomiToku で漫画のOCRを試す

2か月前

iPhone メモ&カメラ便利機能

基盤モデルなどを使いながら、文章をOCRするメモ

2か月前

市販のスキャンが気に入らない(600文字)

AIで図解の添削! ~ChatGPT-4o アップデートの効果!? 図から日本語を読み取ってくれる!~

PDFや手書き文字を簡単にテキスト化!無料OCRツール&サイトまとめ

2週間前

ドキュメント画像RAGのための検索機能をJDocQAを使って比較(ColQwen2、Jina CLIP v2、OCR+テキスト埋め込み)

2か月前

YomiTokuアップデート情報 v0.7.1

【論文瞬読】OCRの新時代:OCRBench v2で見えてきた言語モデルの実力と課題

7日前

yomitokuでOCRを試してみた

変態2画面タブレット OKPad が届いた!

2か月前

漫画OCRでうっすらとした記憶を見つけたい

2か月前

OKPad縦書きを試す

1か月前

bunkoOCR操作手引き

1か月前

国会図書館デジタルコレクションをOCRする

1か月前

GeminiサイドパネルでPDF をOCRして表形式で出力をやってみた

iPhoneカメラで連続OCR

1か月前

bunkoOCRに愛を込めて ʕʘ‿ʘʔ

1か月前

断ナシ自炊PDFの進化型に挑戦! 『タブレット スタンド タブレット アーム』+iPadで 擬似ドキュメントスキャナーを実現

Qwen2-VLを試して化学実験系の専門データを解読してみるメモ

4か月前

PDFをMarkdownにしてからNotebookLMに読んでもらったら想像より良かった

1か月前

2025年6月期第1四半期 決算発表まとめ

Kindle本を爆速でテキスト化してNotebookLMで使う方法(Mac限定)

¥1,500
7か月前

【PowerShell】Windows標準機能のみを使ってOCR実行

【秒速】一瞬でOCRするショートカットを作る方法

2か月前

名刺画像をアップするだけでシートに自動転記する仕組みづくり!

GPT-4oは画像の座標情報を理解しているのか?

小型マルチモーダルAI「MiniCPM-V」とは?GPT-4Vを凌駕する性能と活用法

4か月前

写真から文字起こしするOCRアプリを4つ比較!長文取り込みはこれがベスト2024【使い方解説】

戸籍収集事務を大幅に削減する! OCRで相関図を自動作成、不足戸籍を“見える化”。相続財産管理システム「AI相続ミツローくん」(EAJグループ、サムポローニア)

外来でAI音声文字起こし①「電子カルテで楽になったからこそ、さらにさらに」

2か月前

【Ollama】誰でも簡単にローカルLLMを呼び出せるオープンソースで画像認識してみた

生成AIとAzure OCRを組み合わせれば、人間と同じレベルの文字読み取り率な件

PDFから文字だけを消すプログラム(ソースコード公開)

音源なしの英語教材で「簡単に」音源を作成して音読練習したい。

1か月前

PDFのOCR処理に革命!? Document Intelligence v4.0 で誰でも簡単にデータ抽出!

理想の電子書籍を語ってみる②

1か月前

Kindleから文字を抜き出して、NotebookLMで読む(Windows)

6日前

書類をスキャンして作成したPDFの文字検索をできるようにする:Acrobat活用術

6か月前

Qwen2-VL-7b-instructにOCRさせてみた

大学入試共通試験「情報I]をAIに解かせてみた。

見比べるストレスをゼロに!OCR作業の効率を改善する手法

2週間前

三菱商事が切り拓く生成AIの新境地:経理業務の革新的効率化

6か月前

iPhoneを使って手書きをデジタルデータにしてみたー!

顧客がGoogleフォームで登録した写真の文字情報を、スプレに自動で反映させる方法(GASを使ったシンプルな画像の文字情報登録の方法)

¥2,500〜
割引あり
5か月前

非構造化データを宝に変える:MinerUと生成AIの威力

アナログメモ(ノート)の保存場所は、Googleドライブが最強かつ最適である理由