見出し画像

ぐん税ニュースレター vol.24 page6 -RPA通信-

ReadAPIが日本語手書き文字に対応

最近はkintoneアプリの作成に掛かりきりでしたが、少し時間に余裕が出てきたので、OCRの方をもう少し活用できないかなと、Microsoft AzureのComputer Visionというサービスをいじってみました。
レシートのデータ化や医療費集計にGoogleのCloudVisionを利用していますが、基本的に印字されている文字が対象で、手書きの領収書はSTREAMEDに流すようにしています。これを内製化できたらデータ化の待ち時間が大幅に短縮できるし、コストも抑えられるのでは?ということですね。
少し調べてみるとComputerVisionのReadAPIというソリューションが、今年2月のデータモデルから日本語手書き文字に対応したらしいのです。
早速、以前に試行錯誤して作ったPythonプログラムを手直しして実験してみました。使ったのはこちらの原稿です。

皆様ご存じの通り、夏目漱石「こころ」の冒頭部分です。文字が下手なのは目を瞑っていただいて、これをReadAPIにかけた結果がこちら。

いかがでしょう?「憚かる」が「聞かる」となっていますが、その他は完ぺきです!走り書きのような、更に乱雑な文字になった場合はさすがに難しそうですが、それでも以前に試した時よりも、かなり現実的なレベルになっています。

ちなみに、下の画像は手書き文字に対応する前のデータモデル(ver.2021-04-12)を利用したものです。一部は読み取れていますが、大部分は文字として認識すらされておらず、とても実用的でない事が一目瞭然ですね。

残念ながら、こちらのReadAPIはPowerAutomate for Desktopのアクションには実装されておらず、RPAで実現しようとすると今回のようにプログラムを書かないといけません。
しかし、一度レスポンスを手に入れられれば、RPA上でどうにでも調理できますので、出納帳のデータ化に一歩近づきました。

どんなことに生かせる?

一般企業を考えると、例えば発注書や納品書の一部分を読み取って販管システムに登録する、といった活用方法が想定されます。誰がやってもできる仕事、でも地味に時間が掛かる……。

そんな業務はロボットに任せてしまいましょう!

弊社でも手探りの段階ではありますが、この記事をご覧になって興味を持たれた方は、ぜひお気軽にお問い合わせください。

システム部 田中

この記事が気に入ったらサポートをしてみませんか?