AI OCRとは?導入方法と実活用例を徹底解説
OCRという言葉は、文書のペーパレス化促進などにより、一般に浸透してきましたが、なかでも、AIを活用した、「AI OCR」が近年注目を集めています。
AI OCRとはAI技術を活用したOCRの仕組みやサービスのことをいいます。
海外ではICR(Intelligent Character Recognition)ともいわれ、AIの特徴である機械学習やディープラーニング(深層学習)によって、文字の補正結果を学習し、文字認識率を高めることが可能です。
AI技術を用いない一般的なOCRの場合では、シンプルな文字ほど誤認率が高くなるという傾向があります。
これはOCRの文字認識をする過程において、線が交差している箇所を数えることで文字を識別するという特徴によるものです。カタカナの「エ」と工事の「工」などをイメージするとわかりやすいでしょう。
このような、一般的なOCRソフトを用いた場合は誤認しやすい文字の違いも、AI OCRを用いれば、学習を重ねることでどんどん認識しやすくしていくことも可能です。
実際、AI OCRを用いても100%の識別精度まではいきませんが、大きな業務効率化につなげられるというメリットがあります。
まず「OCR」とは?
OCR(Optical Character Recognition/Reader、光学的文字認識)とは、手書きや印刷された文字をイメージスキャナやデジタルカメラによって読みとり、コンピュータが利用できるデジタルの文字コードに変換する技術のことを言います。
OCRがどのように文字認識をするのか、新聞や雑誌などを読み取る活字文書OCRの例を用いてご紹介します。
1 スキャナで画像取り込み
まず、新聞・雑誌などの文字情報が載った文書をイメージスキャナで画像として取り込みます。
この処理は、一般に写真などをスキャナで取り込むことをイメージするとよいでしょう。
2 レイアウト解析
新聞・雑誌の多くは、単に文字が同じ並び方で並んでいるだけではなく、段組みがあったりコラムがあったり、また表や図がレイアウトされています。
このようなレイアウトを認識し、画像と文字領域を分離した上で、取り出した文字を「かたまり」として取り出し、配置位置を解析し、自動的に文字認識を進める順番を決める処理にあたります。
3 文字の切り出し
レイアウト解析で検出した文字領域の「かたまり」を、1行1行に分解し、分解された行から、さらに1文字ずつに分解する処理を行います。
4 文字認識
1文字ずつ分解した後、その文字が何の文字かを認識する必要があります。
ここで、後処理がしやすいように、文字を一定の大きさに拡大または縮小しておきます(正規化)。
そしてその文字が持つ特徴(たて、よこ、斜めのどのような線で構成されているか)を決めます(特徴量抽出)。
見つけた特徴に合致する文字をデータから探して、候補にします(マッチング)。
最後に、前後の文字列の候補と、日本語の単語情報と照合するなど、文章としての整合性を確認し、最終的に文字を確定します。
5 フォーマット出力
文字認識が終わった後、さらにExcelやWord等で、文字データとして利用できるように元の文書形式で出力できるフォーマットに変換し、ファイル出力します。
AI技術を活用した「AI OCR」とは?
「AI OCR」は、OCRにAI技術を加えた技術で、AIを組み合わせることで、機械学習による文字認識率の向上や、帳票フォーマットの設計をせずに、項目を抽出することが可能になりました。
とくに日本では、契約書類、依頼書などの申込用紙やアンケート用紙など、各種の文書のデジタル化が遅れており、今日でも紙帳票からの入力が数多くあります。
これらの入力作業では、活字のOCRによる効率化は徐々に進んできていますが、手書きの認識率はそれほど高くなく、実用化が難しい領域と言われてきました。
とくに、日本語の漢字やひらがな、カタカナには複雑なパーツが分かれている文字が多いため、OCRによる入力効率化の障壁となっています。
このようなOCRの現状に、新たにAI技術をかけ合わせることで、以下のようなメリットを享受できます。
・ディープラーニング(深層学習)により読み取り精度が継続的に向上
ディープラーニングを用いることで、誤認識を学習し、文字認識率を継続的に向上可能です。
また、これを応用すると手書き文字に対応できます。
従来のOCRは、すでに持っているロジックの範囲内での決められたパターンでのみ文字を識別していました。
しかし、「AI OCR」では、AIにディープラーニングさせるため、一度文字を読み間違えたとしても、間違えたデータをAIが学習することができるので、文字認識率を継続的に向上することが可能になりました。
・フォーマットが異なる帳票に対応可能
帳票をOCRする場合には、従来の方法では、事前に読取位置や項目の詳細定義を手作業でする必要がありました。
「AI OCR」では、AIにより読取位置や項目を自動抽出することが可能になるため、紙ベースの資料をスキャンするだけで文字を認識してくれるいわゆる、「設計レス」を実現しました。
例えば、請求書や納品書、発注書といった様々なフォーマットの帳票であっても、スキャンするだけで項目を抽出できるので、業務効率を大幅に向上させることができます。
・業務システムやRPAとの連携でさらに作業効率が向上
OCRを活用することで、例えば、紙の請求書の情報を会計システムなどの業務システムに入力する作業を効率化することができます。
ただし、実際に業務システムに入力する際には、請求書に書かれている文字や数字のテキスト情報だけでなく、その情報が何を意味するのかによって対応が異なるため、その関連付けなどを、人間が手作業で行う必要があったり、あらかじめ設定してある決まったフォーマットの帳票にしか対応できなかったりするといった制約がありました。
「AI OCR」では、読み取った情報が何の項目で、業務システム入力に必要な情報は何であるか、なども自動抽出、自動生成できるので、業務システム入力作業の効率を大幅に向上できます。
このように、情報の関連付けができるので、「AI OCR」と「RPA(Robotic Process Automation)」と連携することで、業務効率をさらにアップすることが可能です。
「RPA」とは、今まで人が行っていた業務をソフトウェアロボットにより代替し自動化することを表す言葉です。
「RPA」と「AI OCR」を連携させることにより、パソコンを使った作業の自動化に加えて、文字データを自動で読み取り、デジタルデータ化することが可能になります。
これを「AI OCR」と組み合わせれば、紙の帳票からデータを自動抽出し、データ入力・集計・加工・出力といった一連の業務を自動化することが可能となります。
AI OCRのビジネスへの活用事例
AI OCRの導入で実際にどのような業務課題が解決されるのでしょうか?
大量の紙書類の処理をAI OCRとRPAで自動化|大手都市銀行
ある大手都市銀行では行員の生産性向上による営業強化のためルーティン業務の見直しに着手しました。
AI OCRとRPAでネットバンキングの申込書類の処理などを自動化し、業務効率化を実現しています。
・課題
担当者が、銀行内で効率化できる業務はないかと本部各部に調査したところ、各部門から約900の業務が挙がってきました。
この効率化のため、当時活用が進んできていたRPAが候補にあがりましたが、900業務のうち約半数が紙を介在した業務であったため、そのままではなかなかRPAにはつながりにくい部分がありました。
RPAで業務を自動化するためにはその情報がデジタル化されていることが、大前提です。
手入力でのインプット作業に膨大な時間がかかり、対象業務を拡大する上でかなりのボトルネックとなっていました。
・効果
そこで検討し始めたのが、従来より精度が上がってきている手書きAI OCR技術の活用です。
手書きされた紙を起点とする業務もRPAの対象として諸々の処理を自動化できるようになったことにより、点検済契約書のイメージ化など付随する業務も含め、RPAによる処理の対象とできたことで、処理スピードが上がり、業務量についてもだいぶ削減できる見込みとのこと。
また、銀行業界では今、RPAやAI OCRへの注目度が高まっており、運用し始めたばかりではあるものの、先行して導入、活用を始められたことは自信にもつながったとのことです。
AI OCRの導入方法
続きは以下、MatrixFlow記事をご覧ください(無料で閲覧できます)
MatrixFlowでは一緒に世界を変えるAIプラットフォームを作る仲間を募集しています!!