マガジンのカバー画像

ICT活用あれこれ

37
運営しているクリエイター

#OCR

文字認識結果から名詞のみを抽出する

きっぷをOCRかけた結果から、「発駅は国府である」という情報を抽出したい、で終わったのが前回。

駅名は名詞。
なので、
認識結果から名詞を抽出

名詞の中から駅名を抽出

きっぷの位置情報から発駅・着駅を判定

とするとよさそう。
人間の目の動きもそんな感じの気がするし。

じゃあ、どうやって名詞を抽出しようか?
ということで、自然言語処理をかけてみましょう。
今回使ってみるのは、NTT印の

もっとみる

きっぷに記載の文字にラベル付けをする

前回の続き。

文字を検出するだけなら、OCRかけるだけなのでそれほど難しくないのです。問題はここから。文字と位置から、列車名・号車・座席+発駅・発車時刻・着駅・到着時刻を特定したいのであります。あ、乗車日も欲しいですね。

人間の目で見るとあらためてきっぷの写真を見てみましょう。

列車名  → 115号
号車   → 2号車
座席   → 9D

乗車日  → 5月29日
発駅   → 国府

もっとみる

きっぷの文字認識結果をマッピングする

前回の続き。名鉄ミューチケットの色を落とすことによって、Googleドキュメントでいい感じに認識ができました。

では、Google Vision APIで位置情報と合わせて取ってみましょう。
使う画像は境界値(R,G,B)=(120,120,120)で色を落とした画像です。

で、検出した位置情報を四角で囲う。
検出も大きい単位からblock単位、paragraph単位、word単位があるので、

もっとみる
名鉄ミューチケットを文字化する

名鉄ミューチケットを文字化する

前回の続き。

名鉄ミューチケットの文字情報名鉄ミューチケットの文字情報として、「印字された切符の情報」と「台紙の【MEITETSU】」があります。そして、この2つの縦横が異なっています。

「印字された切符の情報」を正方向とすると、「台紙の【MEITETSU】」が横になるし、「台紙の【MEITETSU】」を正方向とすると、「印字された切符の情報」が横になる。

前回、Googleさんは「台紙の【

もっとみる
きっぷの文字化をしてみる

きっぷの文字化をしてみる

続編です。

手元に過去の指定席券があるので、いくつか試してみる。
きっぷのままだと使いづらいので、まず写真を撮る。
そして、GoogleドキュメントでOCR。
欲しいのは、列車名・号車・座席。
発駅・発車時刻・着駅・到着時刻は取れればうれしい、程度で。

では、やってみます!

1つ目(JR九州、特急かもめ)

完璧。欲しい情報が全部取れてます。

2つ目(JR東日本、特急ひたち)

到着時刻の

もっとみる

APIを使ってみよう(Google Vision API)

この記事で、GoogleドキュメントのOCR機能を使いました。

でも、Googleドライブにアップして、Googleドキュメントで開く、というのを毎回実行するのは手間です。

画像を渡したら、文字認識した結果だけ返してくれればいいんだけど。
もっと自動でできないもんかね?

という感じに、プログラムの「一部機能だけが欲しい」といったことはありませんか?膨大な機能の中の、一部だけが使いたい。付随す

もっとみる
画像の文字起こしをしてみよう

画像の文字起こしをしてみよう

こんな画像から文字起こしをしたいと思ったことはありませんか?
観光地に行くと、こんな掲示は結構見ます。

「写真を撮っておいて後で見返そう!」と思っても、ファイルは画像のままなので、検索にも使いづらい。せいぜい、いつどこで撮ったっけ?と思い出して探すくらいです。

検索とか翻訳にも使うなら文字起こしして、テキスト情報にする必要がありますが、手作業で書き起こすとなると大変ですよね。

そこで、OCR

もっとみる