顧客がGoogleフォームで登録した写真の文字情報を、スプレに自動で反映させる方法(GASを使ったシンプルな画像の文字情報登録の方法)
様々なシーンで画像からの文字情報の自動登録は役立ちます。
例として
1. 教育・研修
学生の成績表管理: 生徒が写真で提出した手書きの成績表をデジタル化し、自動的にスプレッドシートに反映させる。
宿題・課題の提出: 学生が手書きの宿題やレポートを写真で提出し、それを教師がデジタル化して管理。
トレーニング記録: 研修生が実技試験やトレーニング結果を手書きで記入し、写真で提出することで記録を管理。
2. 医療・ヘルスケア
患者カルテのデジタル化: 手書きの診療メモや処方箋を写真で撮影し、カルテシステムに自動的に反映。
フィットネス記録: 顧客が運動日誌や体重記録を写真で送信し、フィットネストレーナーが進捗を管理。
患者登録情報の管理: 患者が保険証や同意書の写真を送信し、病院のシステムに自動的に反映。
3. 不動産・住宅
物件情報の収集: 不動産エージェントが物件の情報を手書きで収集し、写真を送信してスプレッドシートに反映。
リフォーム・修繕記録: 工事業者が施工前後の写真やメモを送信し、進捗をスプレッドシートで管理。
顧客情報の管理: 顧客が手書きで記入したアンケートや契約書の写真を送信し、データをスプレッドシートに自動で反映。
4. 小売・サービス
在庫管理: 店舗スタッフが手書きで在庫状況を記録し、その写真を送信して在庫システムに反映。
顧客アンケート: 顧客が手書きで記入したアンケート用紙の写真を送信し、結果を自動集計。
予約・注文管理: レストランやサービス業で、顧客が手書きで記入した予約票や注文票を写真で送信し、予約管理システムに反映。
5. 製造・品質管理
検査記録の管理: 品質管理担当者が検査結果を手書きで記入し、写真を送信してスプレッドシートで管理。
製造指示書の確認: 工場スタッフが手書きの製造指示書を写真で送信し、指示内容をデジタル化して管理。
製品のロット番号管理: 手書きで記入された製品ロット番号を写真で記録し、追跡システムに反映。
6. 物流・運輸
配送指示のデジタル化: 配送スタッフが手書きの配送指示を写真で送信し、スプレッドシートで配車管理。
荷物の受領証: 受領者が手書きで記入した受領証の写真を送り、配送記録としてスプレッドシートに保存。
倉庫の在庫記録: 倉庫スタッフが在庫記録を手書きで残し、写真を送信して在庫システムに自動反映。
7. 法律・財務
契約書の管理: 顧客が手書きでサインした契約書の写真を送信し、スプレッドシートで契約内容を管理。
領収書・請求書の管理: 顧客が手書きの領収書や請求書を写真で送信し、経理システムに反映。
顧客との合意書管理: 手書きで作成された合意書の写真をデジタル化し、契約管理システムで追跡。
8. イベント・エンターテインメント
参加者リストの管理: イベント参加者が手書きで記入した登録用紙の写真を送信し、リストに反映。
フィードバック収集: イベント後に参加者が手書きで記入したフィードバックフォームを写真で送信し、結果を自動集計。
アートコンテストの作品提出: 参加者が手書きのアート作品を写真で送信し、審査システムに反映。
9. 観光・旅行
旅行プランの管理: 顧客が手書きで記入した旅行プランや希望を写真で送信し、プランニングに反映。
ツアーガイドの記録: ツアーガイドが手書きで残したメモや評価を写真で送信し、ツアー記録として保存。
訪問者ログ: 観光地で訪問者が手書きで記入したログブックの写真を送信し、デジタル記録として保存。
10. マーケティング・リサーチ
市場調査のデータ収集: 調査員が手書きで収集したデータを写真で送信し、スプレッドシートに自動集計。
キャンペーンの応募管理: 顧客が手書きで応募したキャンペーン用紙の写真を送信し、応募データを管理。
顧客意見の収集: 顧客が手書きで記入した意見フォームを写真で送信し、意見を集計して分析。
これらのシーンで、Googleフォームとスプレッドシート、そしてOCR技術を組み合わせることで、手作業の入力を自動化し、業務効率を大幅に向上させることが可能です。
OCRサービスとしては以下が考えられます。
表形式の文字列をそのまま読み込み、正確にデジタル化するためには、高精度なOCR(光学文字認識)技術が必要です。以下は、表形式のデータを正確に読み取るためのいくつかの優れたOCRツールおよびサービスです。
1. Adobe Acrobat OCR
特徴: Adobe Acrobatには組み込みのOCR機能があり、特にPDF文書内の表を認識してExcelやWordに変換するのに優れています。表形式のデータを高精度で読み取って、編集可能なテキストとして出力します。
使用方法: スキャンされたPDFを開き、"Export PDF"オプションを選んで、"Excel Workbook"や"Word Document"として保存する。
2. Microsoft Azure Computer Vision
特徴: Microsoft AzureのComputer Vision APIは、表形式のデータを正確に読み取る機能があります。特に、手書きや印刷された表を自動的に認識し、テキストとレイアウト情報を抽出することができます。
使用方法: APIを使用して画像を送信し、戻り値としてJSON形式で認識されたテキストを受け取ります。
3. Google Cloud Vision OCR
特徴: Google Cloud Visionは強力なOCR機能を提供し、テーブルや表形式のデータを認識してテキストとして抽出できます。Google Sheetsや他のGoogleサービスと連携しやすい点も利点です。
使用方法: APIリクエストを使用して画像を送信し、戻り値としてJSON形式で認識されたテキストを受け取ります。さらに、表形式のデータを保持するために後処理が必要になる場合があります。
4. ABBYY FineReader
特徴: ABBYY FineReaderは、高精度のOCRソフトウェアで、特に表形式のデータを正確に読み取り、編集可能なフォーマット(ExcelやWordなど)に変換することに長けています。
使用方法: スキャンされた文書を開き、"Export"オプションでExcelなどの形式を選択します。
5. Tesseract OCR
特徴: TesseractはオープンソースのOCRエンジンで、高度なカスタマイズが可能です。特に、Pythonなどのプログラミング言語と組み合わせて、表形式のデータを特定のフォーマットで抽出するように調整できます。
使用方法: Tesseractをインストールし、表形式のデータを含む画像を処理するスクリプトを作成します。追加の処理が必要になる場合がありますが、フリーソフトウェアとしては非常に柔軟です。
6. Amazon Textract
特徴: Amazon Textractは、単にテキストを抽出するだけでなく、ドキュメント内の表やフォームの構造を理解してデータを抽出する高度なサービスです。特に複雑な表や文書の解析に適しています。
使用方法: APIを通じて画像やPDFを送信し、テーブル構造やフィールドを認識してJSON形式でデータを取得します。
おすすめの選択肢
Adobe Acrobat OCRやABBYY FineReaderは、ユーザーにやさしいインターフェースと高い精度を持ち、デスクトップソフトウェアとして優れた選択肢です。
Microsoft Azure Computer VisionやGoogle Cloud Vision OCRは、クラウドベースのAPIを利用して、プログラムで処理する場合に適しています。
Amazon Textractは、より高度なテーブル解析や大規模なデータ抽出が必要なシーンで優れています。
これらのOCRを自動で使うには、自動化ツールに対応しているかどうかに寄ります。現状では下記のようになります。
1. Microsoft Azure Computer Vision OCR
Make: 使えます。MakeはAzureのAPIと連携できるので、Azure Computer VisionのOCR機能を使って手書き文字を認識し、データを取得することが可能です。
Dify: 現状ではサポートされていません。
n8n: 使えます。n8nはHTTPリクエストノードを使用してAzureのAPIと連携できるため、OCR機能を利用できます。
2. Google Cloud Vision OCR
Make: 使えます。MakeはGoogle Cloud Vision APIと簡単に統合できるため、画像の文字認識を自動化フローに組み込むことが可能です。
Dify: 現状ではサポートされていません。
n8n: 使えます。n8nではGoogle Cloud Vision APIを呼び出すことでOCRを利用できます。
3. Amazon Textract
Make: 使えます。MakeはAWSのサービスとも連携できるため、Amazon Textractを使ってOCRを実行することが可能です。
Dify: 現状ではサポートされていません。
n8n: 使えます。n8nではAWSのAPIを呼び出してAmazon Textractを利用することができます。
4. ABBYY FineReader
Make: 使えません。ABBYY FineReaderは通常デスクトップアプリケーションとして提供されるため、APIを通じた連携は一般的ではありません。
Dify: サポートされていません。
n8n: サポートされていません。
5. Tesseract OCR
Make: 直接利用はできませんが、サーバー上でTesseractを実行し、結果をMakeに送信するような構成は可能です。
Dify: サポートされていません。
n8n: 直接利用はできませんが、Tesseractをサーバー上で実行し、その結果をn8nに渡すことは可能です。
上三つが使えるのが分かりましたが、料金がかかるのでそれを比較すると、
1. Microsoft Azure Computer Vision
無料枠: 5000トランザクション/月
価格:
OCR API: $1.50 USD / 1000 トランザクション
手書きテキストの認識: OCR APIの料金に含まれる
カスタムビジョン: 使用量に基づくカスタム料金
2. Google Cloud Vision OCR
無料枠: 1000ユニット/月
価格:
ドキュメントテキスト検出(表やブロックの解析): $1.50 USD / 1000ユニット(1ページにつき1ユニット)
手書きテキスト認識: $1.50 USD / 1000 ユニット
画像ラベル検出などの他の機能も価格に含まれる
3. Amazon Textract
無料枠: 1000ページ/月(最初の3ヶ月)
価格:
ドキュメントテキスト検出: $1.50 USD / 1000ページ
テーブルデータ、フォームデータ抽出: $15.00 USD / 1000ページ
OCR(基本的な文字認識): $1.50 USD / 1000ページ
価格比較のポイント
AzureとGoogle Cloud Visionは同じ価格帯であり、1000トランザクションまたはユニットあたり$1.50 USDです。
Amazon Textractは、ドキュメントテキスト検出では他の2つと同じ価格ですが、テーブルやフォームのデータ抽出が必要な場合、料金が高くなります($15.00 USD / 1000ページ)。
選択のポイント
Azure Computer Vision: シンプルなOCRや手書き認識に適しており、他のAzureサービスとの連携を考慮する場合に有利です。
Google Cloud Vision: 高い精度と多機能なAPIを持ち、Google Cloudのエコシステム内で使う場合に便利です。
Amazon Textract: 特にフォームやテーブルの解析が必要な場合に優れていますが、基本的なOCRのみを必要とする場合には他の選択肢がコスト的に優れています。
ビジネスニーズや使用する機能に基づいて、これらのサービスの中から適したものを選ぶと良いでしょう。結局、マイクロソフト、グーグル、アマゾンという大手サービスとなりますが、簡単な文節一つ程度ならマイクロソフトのAzureで、GoogleのGASの中で使うならグーグル、表になっているような複雑なものならアマゾンでしょうか。
今回は、GoogleのGASを使った画像の文字情報を読み込む自動プログラムの作り方を紹介します。
具体的にどのように設定していくかをこれから説明していきます。
ほぼすべてコピペでできるので、誰でも実装できるはずです。
まず、GAS(GASとはGoogle製品の中でのプログラム処理のシステムのことです)を使って、Googleのサービスの中だけで完結する方法を説明します。ここではGoogle formに投稿された画像から得られる文字すべてをスプレに落とし込む方法を説明していきます。最初にGoogle formで写真を得るアンケートを作ります。そのアンケートで写真が送られるたびにその写真に載っている文字情報を読み込んで、専用のスプレッドシートに日付と相手のメールアドレスとともに書き込んでいくツールになります。
ここからは有料になります。時間がないとか、頼みたい人は個別に請け負うので、info@renmons.comに「NC001」とタイトルを付けて送ってください。
ここから先は
Amazonギフトカード5,000円分が当たる
この記事が気に入ったらチップで応援してみませんか?