AIが古代言語を解き明かす
過去解き明かせなかった謎を最新技術が解き明かす。
理想的な話ですが、まさに古代文字をAIが解き明かしつつあります。
要は、
オックスフォード大学がAIを活用して碑文をより正確に解析する仕組みを実現した、
という話です。
システムの名称は「Ithaca(イサカ)」、古代ギリシア叙事詩オデュッセイアに登場する島の名前からとっています。
古代文字が書かれた碑文を考古学者だけで解読しても、20%台しか実現できないところを、AIと組み合わせたら70%超まで向上するそうです。
ここを聞くだけでもすごいパフォーマンスですね。
碑文が難しいのは、そもそも文法が確立しているわけでもなく、データ自身が欠損しているのでそれを推論することも必要です。
AI開発チームは、古代ギリシャの碑文7万8608件からなるデータセットで学習し、古代ギリシャ人が残した碑文の文章や年代、起源を推測できるようにしました。
そのチームが、Googleが買収したAIベンチャーDeepMindです。
AIに関心がある人ならお馴染みで(囲碁世界チャンピオンに勝ったのもここ)、過去もその偉業を時系列で紹介したこともあるので、引用しておきます。
実は、過去に解読されていない文字をAIで解析した話がもう1つあります。
これは古代でなく中世の奇書「ヴォイニッチ手稿」の解読です。
制作は1400年代と特定されましたが、誰が何のために書いたのかが分からず、奇書として取り扱われています。
名称は、20世紀にこの本を入手した方の名前をとって名付けられました。
「中世なので簡単では?」と思うかもしれませんが、なんとこの本に書かれた文字は過去の言語体系にどれにも当てはまらないものでした。
数百年も言語学者たちが挑戦しましたが、今も解読に成功はしていません。
状況が変わったのが2016年です。
カナダのコンピュータ科学者が、AIを活用することで、その一部の解読に成功したと発表しました。
要は、
AIを活用してヘブライ語のアナグラムと予想し、Google翻訳も援用することで、序文の解読に成功した、
という話です。
ヘブライ語は旧約聖書でも使われていた古代言語で、今でも形態を変えて一部の地域(イスラエルなど)で使われている言葉です。
AIが400種類近くの辞書からヘブライ語に最も近いと類推し、しかもその配置換え(アナグラム)で大半の言葉がヘブライ語と特定されました。
ただ、生憎ヘブライ語の専門家が見つからなかったそうで(これが実際いないのか協力してくれなかったのかは不明)、結局Google翻訳を使ったそうです。まさに今風なエピソードですね。
その結果、初めの序文が解読され、下記が判明しました。
「She made recommendations to the priest, man of the house and me and people(人々や私、そしてその家の男である聖職者に彼女は勧告した)」
なかなか想像力に富む序文ですね。今もこの解析が進んでいるそうですが、これもAIのパワーです。
もし今回の具体的な解析手法に興味を持った方は下記から論文を見ることが出来ます。
これはどちらかというと、ヴァイニッチ手稿という奇書に絞ったアプローチですが、冒頭記事のAIは汎用的な仕組みを備えているそうです。
つまり、評価は古代ギリシア語でおこなってますが、マヤ語、くさび形文字、パピルスなどあらゆる古代文字に対応できるよう設計されています。
ぜひ興味を持った方は、下記の公式サイトをご覧ください。
なんと実際に古代語(現時点は古代ギリシア語のみ対応)入力して即時翻訳することができます。
サービスが開始されたばかりですが、これで一気に古代語の解読が進むことは期待できそうです。
ぜひこれから古代ロマンのニュースに注目していきましょう。