古文書カメラでなかよし百人一首を解析してみた
古文書カメラ ふみのは
古文書解析アプリが出たという噂を聞きました。どうやら古文書の画像をAIが解読してくれるようです。
解析対象
これまでパステルプラネットは、なかよし百人一首の画像を使って、画像生成AIのStable DiffusionでLoRA学習ファイルを作成してきました。
百人一首の画像を学習させる際にタグ付け(画像情報の設定)をするのですが、そこに書いてある1文字1文字の情報も学習させられないかなと試したこともありました。しかし、ノリでやる程度ではうまくいかずその点については保留にしていました。
というわけで、このアプリを使ってAIが解読できるか試してみます。
解析開始
解析の際には、かな多め or 漢字多め、太さ均一 or 太さバラつきありとでAIのタイプを選択しました。
なかよし百人一首の書は変体仮名を基本に割とオリジナリティのある作風になっているので、どちらのAIを選ぶか画像を見て判断してみます。
まずは、覚えやすい天智天皇の歌から。
天智天皇
10秒くらいで解析結果が出ました。
「天替其皇秋方田の可梨被村庵の啓をあ王事者手つ露に為れへ〳〵」
お〜!正答率割と高い!甘めにみて、16/30正解。53%!中には解析されていない文字もあります。でも下の句の「わが衣手は」の「は」は、変体仮名の「つ」(津)に似ているので、画像としては正しく分析してくれている気がします。すごい!
小野小町
次は女性。歌の雰囲気と女性の歌ということで、ひらがな多めの作品だと思います。さっきとは別のAIを選んでみます。
おおお!!もっと読めてます!24/35文字で68.5%
紫式部
調子を良くして、女性陣を読ませてみました。紫式部は原本に不備がありました。一応載せますね。
左右の2文字を1文字と捉えているところが惜しい。また続き字をうまく読み取れていないところも。でも20/30文字で、正答率66.7%!
清少納言
この作品は原本がニョロニョロしすぎず割とはっきり書かれていて読み取りやすいかも。清少納言はどうでしょう。
イラストの一部も文字だと認識してしまいました。また「夜をこめて」の「こめ」を1文字だと認識していました。(上の画像は、最初の解読の後操作を加えたので個別に認識したような画像になっていますが、デフォルトだと1文字に解読されていました。)正答率は24/34文字で70.6%!7割を超えました。
後鳥羽院
作品の中でこれは読みやすく書いてあるので、読んで欲しいという気持ちも込めて、後鳥羽院の作品も読ませてみます。
29/34文字、85.3%行きました!!やっぱりこれは読みやすい作品だったようです。動物の顔も文字と認識されてしまっていますが、好成績を収めてくれました。
不思議で書〜fushigidesho〜
最後にこのなかよし百人一首を使って学習させたモデルである不思議で書を使ってできた作品を解析してみます。生成された作品は文字が書かれているのはわかりますが、出鱈目に見えます。まるで秘密の古文書のよう。結果はどうでしょう?
京助州會に様ゟれ中家案文成業れ謹言だ相方に共本躰。
案文、謹言、相方…なんだか暗号のようですね。
結構それっぽく雰囲気出ている文面になっています。京助州會、華岡青洲みたいな…人名みたい。
感想
というわけで、アプリの評価としては結構好成績だし、個人的には⭐️4つくらいでしょうか。ストアの評価は「使えない〜」と書いてある方もいらっしゃいますが、LoRA学習する際に文字を学習させるのは結構難しいというのを実感しているため、ここまで読めるのはすごいなと単純に思いました。画像生成AIで単純なアルファベットを出すのも難しかったので。
やはり1文字1文字切り出すのが難しいですね。
古文書カメラ、無料で使えるのは10回分のようですが、楽しく使わせてもらいました。