エセー「なぜ完全な翻訳は現れないか」

Unferth(ウンフェルス)

2022年6月12日 10:22

「エリート剣客」一宮真純さんがつぶやいた素朴の疑問からこのNoteを書き始める。

大疑問：なぜ機械翻訳は上手くいかないのか、自分の能力をゲームのように数値化できないか

小疑問：なぜあらゆる文章を翻訳できる万能翻訳機は現れないか

具体例、日本語同士で

これは言語の働きに由来する。
そも、この世界は言語で「区切れる」ようにできていない。

言語学でよくある椅子の話をしよう。
椅子とはなにか？
デジタル大辞泉のような辞書を引くと「腰掛けるための家具」とある。

さて、人間が腰掛けるために作った家具は言うまでもなく椅子であり、
これは作者が椅子だと主張すれば多くの人の合意を得られるだろう。

では自然にできた切り株は椅子にならないだろうか？
もちろんなる、椅子として使うことができる。

これはもちろん切り株が椅子で生まれたというお話ではなく、
ある人が切り株を椅子として使っている、
あるいは切り株を椅子と定義した、といえる。

なので前提として「椅子を椅子としたのはある人」であると言える。

なぜある人と限定するかと言えば、
それは人によって椅子の定義が異なるからである。

具体的な話をしよう。
その椅子は表面がザラザラして、あるいは突起があり大変座りにくい。
足の数は2本だが、足の長さが不安定で座ると揺れる。

さて、これを作った人は椅子であると言った。
なぜなら椅子として作られたからである。

しかしある人はこれは椅子でないとした。
「この椅子は椅子に足る能力を持っていない」と。

大変不思議な話である。
おそらくこの”出来損ないの椅子”は椅子としての要件を満たしている。
だが、だから無条件に椅子であるとは言えないのである。

たいていこういうことは「真の」と区別されることがある。
「この椅子は真に椅子とはいえない」等。

この場合は広義に、つまり大雑把な定義と、
狭義の意味、つまり厳密な意味を区別して発言しているといえる。

「真の椅子」は座り心地がよく、
他方、広義の椅子は単に座れるもの……のような理解である。

ここで広義だとか狭義だとか小難しい線引きをするのは、
「言葉をお互いに理解するため」である。

言葉の理解は実のところ個人差があり、
個人差をすり合わせるためにどんどん細かく区切るということはしばしば行われる。

では極限まで厳密に、
細かく仕切ればすべての人の了解が得られるかというとそうでもない。
むしろ場合によっては細かく区切れば区切るほど合意が得られないということがある。

以上の具体例が示すのはなにか？

言葉は大雑把に仕切っても細かく仕切っても個々人バラバラのものである、ということである。
辞書やマスメディアが、言葉をかろうじて人々に共通認識というゆるい境界を与えている。
とはいえ、この共通認識-別の言葉で言えば常識とか呼ばれるもの-を人々は無条件に受け入れている訳では無い。
なんなら「この辞書はおかしいのではないか」とか「テレビが言うことはおかしい」と言うことを、人はできる。

翻訳：多国語での綱渡り

以上、言葉の意味を共有する難しさを書いた。
さて、以上の言葉は同じ言語での語り合いを前提とした。
では本題の翻訳に戻るとどうなるだろう？

同じ言語同士で、同じ単語でさえこの意味の共有が難しいのに加え、
多言語の問題は翻訳にある。

一見して同じ単語というのは存在する。
林檎とは英語のAppleと同じものであり、
翻訳とは文字通り単語の差し替えである……というのは一つの理解である。
だが、この理解は事実ではない。

まず日本語の話をしよう。
将棋という遊びがあるが、「将棋をする」と書きたい場合、
「将棋を指す」というのが慣例となっている。

さて、では英語にはChaseというgamesがある。
I play chess.
が一塊であり、日本語で補足すればchaseを「する」と書きたいなら、
動詞のplayを使うことになる。

ここで考えたいのだが、日本語でチェスは「指す」のだろうか、「遊ぶ」のだろうか。
これは正直、チェス関係の団体が作る「共通認識」によりそうではある。

しかしここでもしチェスを指すと書いた場合、不思議な翻訳を行っていることになる。
playは指すなのだろうか？こういう場合、この翻訳は「意訳」と呼ばれる。
意訳の対義語は直訳で、意訳は多くの場合恣意的な、意味を伴った翻訳とされる。

しかし意訳と直訳は先程の狭義と広義と同じく程度問題でしかない。
目的を持たねば翻訳はそもそもできない。
それゆえ、翻訳は”厳密には”すべて意訳である、とは翻訳でよく出てくるお話である。

さて、チェスにあたる動詞、指すのか遊ぶのか、なんなら「する」のか、
この困難さはすでに書いた通りである。

では逆に「将棋を指す」は英訳できるだろうか。
戯れに機械翻訳を使うとplay shogiという文字列が出てくる。
おかしくはないが、正しくもない。

指すはやはりplayなのだろうか？
しかし日本語で将棋に指すが関連付けられるのは、
指すの「指揮をする」という意味に由来する。
将棋とは兵隊を指揮するものであり、駒に動けと命令しているのが「指す」を使う由来とされている。

ではこの指すの意味を伝えようとするとどうなるか。
英語の場合、指揮を翻訳するとcommand, lead, take controlなどの単語や一塊の文字が引っかかる。

ではI command shogiとか、I lead shogiと書けば正しいのだろうか？
仮に正しいとして、どちらが正しいのだろうか？

確認しておこう。
言葉は、それ自体世界を区切るものなのである。
世界は言葉で区切られるために生まれた訳では無い。
それゆえ、言葉で世界を区切ると厳密な意味は必ずずれる。
そして、そのずれは個々人がなんとなく消化していて、
ときにそれを共有するとすれ違いが起こる。

それゆえ人間同士でさえこんなに困難が伴う作業は、
機械にも難しい。
機械は正しい情報を元にしたから正しい結果を出すのである。
ノイズまみれの情報を機械に入れても、ノイズまみれの情報が出てくるだけである。

現状、機械学習という形で人間に似た思考で、
つまり「意訳」の型を覚えて翻訳するという翻訳方法は確立されつつある。

しかし、人間がノイズの元である以上、
完全な翻訳が現れることはありえそうもない。

続き

参考文献
瀬戸賢一『日本語のレトリック』岩波書店 2002年
安田敏朗『「国語」の近代史』中央公論新社 2006年
小林標『ラテン語の世界―ローマが残した無限の遺産』中央公論新社 2006年
増川宏一『将棋』法政大学出版局 1977年
〃『チェス』法政大学出版局 2003年
木村義徳『持駒使用の謎』日本将棋連盟 2001年