DeepLが思い通りに翻訳しない!?②アポストロフィやピリオドがある省略形に注意
DeepL はGoogle翻訳を超える翻訳精度を誇り、あまり手直ししなくとも使える文章を出力してくれますので、情報発信している方、海外の情報を直接入手している方はすでに重宝していると思います。
「DeepL活用まとめシリーズ」では使いこなしのための豆知識を紹介していきます。書きたいネタは結構ありますが、よい例に出会うまでは記事にしにくいため、良い例をまた見つけたときにその都度続編をかきます。
その② アポストロフィやピリオドが省略形、略語を簡易な表現にして翻訳精度アップ!
太字の部分がおかしいですよね。主語はTheyのはずで、「彼らはどうすればよいかわからないそうです。」と訳されるはずが、Renzが主語にされかかっています。
これを修正したのがこちら。
翻訳がだいぶマシになりました。十分使える訳ですね。
変更点を箇条書きします:
Co.からピリオドを取った
don'tをdo notと書き直し
what'sをwhat isと書き直し
he'sをhe isと書き直し
it'sをit isと書き直し
以上です。
どうやらこのアポストロフィ記号が密かにシングルクォートだった(?)みたいです。人によってはそういうタイピングをする人がいるのでしょう。見た目はおなじですからね。でもコンピュータは融通がききません。
”Good morning!”などのようにダブルクオーテーションが発言を意味する記号ですが、シングルクオーテーションもたまに使われます。
省略形の時に使うアポストロフィが、カギカッコ、つまり「おはよう。」と日本語で書くときのあれとして機能してしまい、文章がぶつ切りしていたようです。
それとCo.はCompanyカンパニー(仲間たち)の略でCo.なのですが、これは略語を意味するピリオドなのか、文章の終わりのピリオドなのか紛らわしいのです。
よく使われるCo.だけならばDeepLがうまく処理するかもですが、シングルクォートの問題と合わさってDeepLさんがご乱心してしまったようです。
結論:
アポストロフィやピリオドをつかった省略形を
中学生が書く作文みたいな簡単な表現に
手作業で置き換えてあげると
機械翻訳の精度があがることがある
原因考察
シングルクォート'とダブル"は同じキー上にありますから打ち間違いは考えにくいです。そもそもアポストロフィとシングルクォートは同じ記号だと思います。
クォート記号(”と’)はHTMLとしてウェブサイトに表示された時にフォントに合わせて見栄えのよい文字へと変換されたりすることがたまにあります。
つまり”のフォントが複数用意されているフォントがあり、それを使って見栄えの良いサイトを作ると、人間は読めるけど機械のアルゴリズムは読めない文章が完成するのです。
それに似た問題かもしれませんが、どうやってこれが起こったかはちょっと謎です。しかし、直し方は説明した方法で可能です。
おまけ
因みにアメリカでアポストロフィって言い方はするのかもしれませんが、住んでた時に聴いた覚えがありません。みんなプライムって言いますね。
Adenosine-5'-triphosphate
とかもファイブプライムと読みます。
ピリオドもむしろドットと言うことが多いです。短く言いやすいからでピリオドも間違いではありませんが。