見出し画像

DeepLが思い通りに翻訳しない!?②アポストロフィやピリオドがある省略形に注意

DeepL はGoogle翻訳を超える翻訳精度を誇り、あまり手直ししなくとも使える文章を出力してくれますので、情報発信している方、海外の情報を直接入手している方はすでに重宝していると思います。

DeepL活用まとめシリーズ」では使いこなしのための豆知識を紹介していきます。書きたいネタは結構ありますが、よい例に出会うまでは記事にしにくいため、良い例をまた見つけたときにその都度続編をかきます。


その② アポストロフィやピリオドが省略形、略語を簡易な表現にして翻訳精度アップ!

Thomas Renz says he has people on the inside feeding him information that Fauci & Co. are beyond panicked. They don’t know how to stop what’s coming. Renz says he’s already won, it’s a matter of when.
The biggest tie into his lawsuit is finding out the DOD and Intelligence Community are involved in the origins of Covid.
Hunter Biden is one of the single connecting pieces that ties this all together.

トーマス・レンツは、ファウチと共同開発者がパニックに陥っているという情報を、内部の人間から得ているそうです。どうすれば止められるか分からないそうですレンツは、彼はすでに勝っている、それは時間の問題であると言う。
彼の訴訟で最も重要なのは、国防総省と情報機関がコビッドの起源に関与していることを突き止めたことです。
ハンター・バイデンは、この件をつなぐ唯一のピースです。

WTMjp

太字の部分がおかしいですよね。主語はTheyのはずで、「彼らはどうすればよいかわからないそうです。」と訳されるはずが、Renzが主語にされかかっています。

これを修正したのがこちら。

Thomas Renz says he has people on the inside feeding him information that Fauci & Co are beyond panicked. They do not know how to stop what is coming. Renz says he is already won, it is a matter of when.
The biggest tie into his lawsuit is finding out the DOD and Intelligence Community are involved in the origins of Covid.
Hunter Biden is one of the single connecting pieces that ties this all together.

トーマス・レンツは、ファウチとその仲間がパニックに陥っているという情報を、内部の人間から得ているという。彼らは、これから起こることを止める術を知らないのだ。レンツは、彼はすでに勝利しており、それは時間の問題であると言います。
彼の訴訟で最も重要なのは、国防総省と情報機関がコバイドの起源に関与していることを突き止めたことです。
ハンター・バイデンは、このすべてを結びつけるたった一つの手がかりなのです。

翻訳がだいぶマシになりました。十分使える訳ですね。
変更点を箇条書きします:

  1. Co.からピリオドを取った

  2. don'tをdo notと書き直し

  3. what'sをwhat isと書き直し

  4. he'sをhe isと書き直し

  5. it'sをit isと書き直し

以上です。

どうやらこのアポストロフィ記号が密かにシングルクォートだった(?)みたいです。人によってはそういうタイピングをする人がいるのでしょう。見た目はおなじですからね。でもコンピュータは融通がききません。

”Good morning!”などのようにダブルクオーテーションが発言を意味する記号ですが、シングルクオーテーションもたまに使われます。

省略形の時に使うアポストロフィが、カギカッコ、つまり「おはよう。」と日本語で書くときのあれとして機能してしまい、文章がぶつ切りしていたようです。

それとCo.はCompanyカンパニー(仲間たち)の略でCo.なのですが、これは略語を意味するピリオドなのか、文章の終わりのピリオドなのか紛らわしいのです。

よく使われるCo.だけならばDeepLがうまく処理するかもですが、シングルクォートの問題と合わさってDeepLさんがご乱心してしまったようです。

結論:

アポストロフィやピリオドをつかった省略形を
中学生が書く作文みたいな簡単な表現に
手作業で置き換えてあげると
機械翻訳の精度があがることがある


原因考察

シングルクォート'とダブル"は同じキー上にありますから打ち間違いは考えにくいです。そもそもアポストロフィとシングルクォートは同じ記号だと思います。

クォート記号(”と’)はHTMLとしてウェブサイトに表示された時にフォントに合わせて見栄えのよい文字へと変換されたりすることがたまにあります。

つまり”のフォントが複数用意されているフォントがあり、それを使って見栄えの良いサイトを作ると、人間は読めるけど機械のアルゴリズムは読めない文章が完成するのです。

それに似た問題かもしれませんが、どうやってこれが起こったかはちょっと謎です。しかし、直し方は説明した方法で可能です。

おまけ

因みにアメリカでアポストロフィって言い方はするのかもしれませんが、住んでた時に聴いた覚えがありません。みんなプライムって言いますね。

Adenosine-5'-triphosphate

とかもファイブプライムと読みます。

ピリオドもむしろドットと言うことが多いです。短く言いやすいからでピリオドも間違いではありませんが。


#ご乱心