時バエは矢を好む
小学生の頃の6年間は恐ろしく長かった。
それが今ではどうだ、瞬きをすれば6年経っているといってもいいくらい。
…という話を今日は書こうと思っていたのだが、ここで頭をよぎったのが、
だった。
これはかつてAIの限界を示す際によく使われた誤訳例だ。
正しくは、「光陰矢のごとし」。
という英文をAIに翻訳させたところ、
「flies(=fly)」を、「飛ぶ」(動詞)ではなく「ハエ」(名詞)
「like」を、「のように」(副詞)ではなく「好む」(動詞)
と認識してしまったという例だ。
高校時代、人間がどのように言語を獲得するのかについて強い関心を持ち、大学ではそれを学びたいと考えた。
自分は完全な文系人間だが、選んだのは工学部の自然言語処理だった。
「自然言語」というのは、コンピューターが理解できる「機械語」という0と1からなる偽言語と対比して、人間が使うふつうの言語のこと。
それを機械的に処理するのが自然言語処理で、その最先端を学ぶため、当時その道で世界的権威だった長尾眞先生の在籍する大学に入った。
その長尾研究室で最初に示された例文が「時バエは矢を好む」だったのだ。
逐語訳しかない機械翻訳の非力さを見て、最先端でその程度なのかと目の前がくらくらしたものだ。
それから長い年月が経ち、今ではご存じポケトークやGoogle翻訳など、かなり高精度な翻訳ができるようになっている。
今どきの機械翻訳がとる手法は、ビッグデータと呼ばれる大量の例文をため込んで、入ってきた文に近そうな対訳を示すという、いわば力業だ。
自分が研究をしていた頃の逐語訳では未来が開けなかったらしい。
なんだ、機械には結局、自然言語は理解できなかったのか。
いや、違う。
人間にだって自然言語が真に理解できているかは疑わしいのだ。
赤ん坊に、これが主語、ここが述語、動詞の後に目的語を持ってきて、文を繋げる場合は接続詞を使って、と誰が教えたというのだ?
赤ん坊は、親が発する大量の言葉を意味不明のまま次々取り込んで、いつの間にかそれを操れるようになったのではなかったか?
これが力業でなくてなんだというのだ。
必死に教科書に向き合ってあれこれ細かい英語を学ぼうとしても身につかないのに、周囲に英語しかない環境に少しいるだけで喋れるようになるのは、結局文法や逐語訳より大量の例文の方が意味を持つことを示している。
後づけで言語というものを体系的に説明するとこうだというのが文法であり、まず文法ありきでは決してない。
言語は学ぶものではなく、体感するものなのだ。
ちなみにGoogle翻訳に「時バエは矢を好む」を英訳させると「Time flies like arrows」となり、それをもう一度和訳させると「時間は矢のように飛ぶ」となった。
おみごと!
(2021/3/21記)
チップなどいただけるとは思っていませんが、万一したくてたまらなくなった場合は遠慮なさらずぜひどうぞ!