機械翻訳(AI翻訳)の出力に自分の感覚をぶっ壊されそう
私は機械翻訳(AI翻訳)の使用に関しては、大筋は反対派でして、例外的に「便利なツール」と捉えているのですが、反対の大きな理由としては、「用語や文法、慣用句(熟語)などの知識・理解を超えた(?)出力がされる場合がある」から、というものなんです。
今回、仕事をしている中でまさにドンピシャの例に遭遇したので、共有したいと思います。
※機械翻訳反対派と言ってはいますが、自分の訳出における違和感を確認するために、敢えて機械翻訳で出力してみて違いを確認する、ということはあります。その出力をそのまま使うということはまずありません。
さて、今回遭遇したのは、基礎出願が、非英語圏におけるPCT出願の英文明細書。出願人の情報などを確認するとその情報が明らかで、翻訳をする原文は、恐らく非英語の原文で書かれた明細書を英訳した(英語ノンネイティブが書いた)英文明細書で、訳しているとところどころ、というよりも、それなりの頻度で、文法がおかしかったり、「これって英語と非英語原文の単語の違いを理解せずに、感覚的に使っているのでは?」というケースが出てきます。
その中で頭を抱えたのが、以下のような一文でした。
この英文を、普通に訳すと以下のようになるかと思います。
"in addition to ~"=「~に加えて、~の他に」という意味(「~」に出てくる内容を受ける)ですから、これに則って訳すと、上の訳のように、in addition toの後の節を先に訳して、その後にin addition toより前の節を訳すことになるでしょう。
ですが、この英文と訳文を改めて読むと、何か違和感を持たないでしょうか。
私が抱いたのは、"predominant/minor"という形容詞表現と、"in addition to"との繋がり(関係性)に対してでした。
英文では、predominantな化合物とminor amountな化合物の関係性を表現しているわけですが、in addition toの用法に則ると、「微量の~に加えて、~が最も優勢な構造である」という訳にせざるを得ません。ですが、この日本語だと、「加えて」という言葉を使うとどうしても違和感を持ってしまいます。節の繋がりとしておかしいですよね。
「加えて」ではなく、「~の他に」という言葉を使ってもこれは同じだと言えるでしょう。predominantとminor amountという、量の多寡を表現する形容詞的表現があるのですから、「~に加えて(~の他に)」という言葉を使うのであれば、本来、
Open-ring/acidic compounds were reported to be minor amount of structure in the mixture, in addition to the predominant structure of non-acetylated compounds.
のように、優勢な構造と微量な構造の対比を逆にしないといけないはずです。
ですので、この英語原文は恐らく、in addition toをsubsequentlyのような意味で(間違って)用いているのではないかと考えることができます。
それを受けると、以下のような試訳が考えられます。
これだと、微妙な表現のブラッシュアップの余地はあれど、文を読んで特に違和感はありませんし、言いたいことも伝わります。
しかし、しかしですよ。
in addition toにsubsequentlyの意味はあるのか?と問われると、辞書をいくつか調べてみましたが、(当然ながら)ないのですよね。
PCTルートだと、原文の誤記などは、可能な限りそのまま記載、という原則があるので、上記のような例だと、一番安全かつ確実な翻訳者の対応としては、試訳(1)の訳文を作成した上で、
のようなコメントを残すことだと思います。
で、私はここまでの調査とコメントをした上で、念のため、機械翻訳だとどのような出力をするのか調べてみたのです。
Google翻訳が一番使いやすいので入力してみたところ、
いやー、これはさすがに驚いたというかお手上げというか。
"in addition to"の訳が「さらに」となっていますが、この記事をご覧いただいているあなたに、この訳は許容されるかどうか、こっそり教えていただきたいのです。
私は、これは流石に許容できないのですよね。上で書いたように、in addition toがsubsequentlyの意味で用いられていることは推定できますし、なんなら、subsequentではなく、"in addition"だったら、原文が言わんとすることは、このgoogle翻訳の出力そのものだと思います。
念のため、in addition toをin additionに変えた英文も載せておきます。
あるいは、additionallyでもいいかもしれませんね。
(2)は、文法的に不十分にも思えますが、それは置いといて、私の頭に最初に浮かんだsubsequentlyよりも、in additionまたはadditionallyを使うほうが、明確かもしれません。
(ここまで考えると、in addition toはin additionの誤記なのかと考えることもできますし、そのようなコメントをするのがスマートかもしれません)
さて、今回のタイトルに関するまとめに入ります。
私が機械翻訳を基本受け付けないのは、今回のように、文法だったり慣用表現を無視した出力がされることが往々にしてあるからなのですよね。
仮に、機械翻訳で吐き出された訳文が、上のGoogle翻訳のものだったとすると、ある視点に立てば「こなれた訳出」になるかもしれませんが、原文に書かれている内容に沿うと、(あくまで私の考えでは)許容できない「原文の内容を等価に表現できていない」ものになってしまいます。
今ではMTPE(機械翻訳のポストエディット)も増えてきていますが、仮に、特許翻訳において、上のような原文と機械翻訳の出力が用意された場合に、PCT出願のルールに則って「わざわざ文意の通らない、間違った訳文に修正する」ことが必要なのかどうか(それが求められることなのか)というところまで、MTPEを使っている翻訳ベンダーは考えていないように思います。
今回の例は、請求項の構成要素などに影響のないものでしたが、これが例えば、請求項の構成要素に関係する単語だったり表現だったりした場合に、使っている機械翻訳がどのような出力をする傾向にあり、それに対して「翻訳者」にどのような対応を求めるのか、という指針・方針を、翻訳ベンダーはきちんと考えられているでしょうか(私が仕事をしている範囲では、そのような指針・方針をきちんと説明している所はお見かけしたことがありません)。
やや熱くなってしまいましたが、話を元に戻すと、今回のような原文のエラー(と思われる内容)を、機械翻訳が勝手に(ビッグデータを用いて)修正して出力してしまうのは、特許翻訳においては、それはそれで問題があると思っていますし、単純に、in addition toを「~、さらに~」のように出力してしまう機械翻訳に対して違和感を持たずに、それを修正せずに見逃してしまう翻訳者になりたくもありません。
言葉というのは、自分が持っている語感や表現力以上に適切に扱えるものではないと考えているので、舟を編む仕事に携わっている人間としては、こういう出力を軽視せずに、コンコンと向き合う姿勢を失いたくはないものです。