画像からテーブル構造の抽出を GPT4V と Instructor を使って実現する
GPT-4V を使って画像から表を抽出し、Instructor を使って表を整形するサンプルコード。Instructor 自体の docs を参照して試してます。
# ライブラリのインストール!pip install instructor -Uqq
Instructorライブラリを使って、GPT4Vから返り値として得たいフォーマットを指定します。
from io import StringIOfrom typing import Annotated, Anyfrom p