OpenAI Assistants APIで請求書データの抽出に挑んでみた
請求書内容を読み取って、会計ツールに登録するような作業はさすがに安定性に欠けるかなと思っていたのだけれども、OpenAIのAssistants APIを利用するとPDFや画像ファイルのOCRを実行した上で必要なデータを抽出してくれるみたい。
ということで、実際にプログラムを作成してみた。
Introduction : PDFの請求書データを読み取る作業今までのやり方だとOCRツールを使ってPDF文書のテキストを抽出し、抽出されたテキストの中から必要な部分だけを正規表現で抜