きっぷの文字化をしてみる
続編です。
手元に過去の指定席券があるので、いくつか試してみる。
きっぷのままだと使いづらいので、まず写真を撮る。
そして、GoogleドキュメントでOCR。
欲しいのは、列車名・号車・座席。
発駅・発車時刻・着駅・到着時刻は取れればうれしい、程度で。
では、やってみます!
1つ目(JR九州、特急かもめ)
完璧。欲しい情報が全部取れてます。
2つ目(JR東日本、特急ひたち)
到着時刻の時刻区切りがハイフンになっているけど、
取れればうれしいの情報なので、これもOK。
3つ目(京成スカイライナー)
駅名表示が2段組み、見た目にも情報が多い。
読めるのか?と思ったら、しっかり読めた。
座席情報の最後の「D」が取れてないのが惜しい。
4つ目(名鉄ミューチケット)
これは読みやすそう!と思ったら、この結果。
台紙の「MEITETSU」を先に判定して、縦方向に読んでしまってる模様。
0点。。。
5つ目(近鉄特急)
号車と座席情報は取れてるけど「号車」の文字が取れていないので、
位置情報から推測する必要あり。
というか、禁煙車のマークが「A」と読まれている模様。
近鉄の場合、列車名がないので、発車駅と発車時刻が必要。
これも読めているからOK。
ん、「津」が取れてないな。。。?
まとめ
精度を上げるにあたっては、画像の加工が必要。
縦でも横でも読める場合の補正とか、縦でも横でも読ませるとか。
今後、名鉄ミューチケットが立ちはだかってきそうな気がします。
まぁ、何はなくともJRから取り組んでいこうかな。