見出し画像

連載企画<Web翻訳 VS 生成AI翻訳>vol.3 日本語前処理・まとめ編

はじめに

こんにちは。言語理解研究所(ILU)開発本部 知識辞書開発部の佐野です。

連載企画<Web翻訳 VS 生成AI翻訳>vol.2 プロンプト検証編」では、生成AI翻訳において、詳細なプロンプトを用いた場合の結果の違いなどについて、お伝えいたしました。
vol.3では、日本語前処理・まとめ編として、Web翻訳において翻訳対象の日本語に前処理を加えて翻訳した場合の結果の違い、また、Web翻訳と生成AIはどちらを使うべきかについてのまとめをお伝えいたします。


日本語の持つ特性とは

まず初めに、日本語の持つ特性について考えてみます。
よく言われるポイントとして、主語の省略があります。英語などでは大半の文で主語が記されているのに対し、日本語では主語が省略された文もよく見掛けます。

また、助詞や修飾表現の省略によって複合語化した表現(「米国の新興企業」を「米新興」とするetc.)、2桁で記した年号(「2024年」を「24年」とするetc.)を用いて書かれることもあります。
他にも、スポーツ記事やマーケット情報記事などではそのジャンル特有の用語(サヨナラ、幕下付け出し、寄り付きetc.)も使用されます。

このような特性は、日本人が理解する上では大きなハードルとなりませんが、多言語への翻訳では誤訳の原因になることがあります。

誤訳事例と日本語前処理による変化

ここからは、DeepL翻訳での誤訳事例を用いて、日本語に前処理を加えることによってどのように改善するのかを見ていきます。

このように、原文そのままでは誤訳してしまうものでも、Web翻訳が翻訳しやすい日本語に調整することで誤訳の解消が可能です。

これ以外に、日本語の特性を含まない事例においても、前処理を加えることで誤訳を解消することが出来ます。
例えば、企業名や人名などの固有名詞は、日本語に対訳を入れ込むことが、効果の高い改善方法となります。

ここまで、翻訳対象文の日本語に前処理を加えた場合の改善例について見てきました。

原文にはない要素を加えることで改善出来るもの、日本語を別の文字列に変更することで改善出来るものがあり、その中にも、日本語から日本語への変更が有効なもの、日本語から英語への変更が有効なものなど、様々な改善方法がありました。

日本人には違和感のない日本語に変更したと思っても、Web翻訳ではうまく訳せない事例もあり、すんなりと解決するものばかりではありません。

日本語の前処理を加える場合には、「正しい翻訳結果を出すための前処理は何が良いのか」という点について考える手間が必要にはなりますが、Web翻訳は翻訳結果の安定性が高いことから、1つの事例で考えた前処理案が、別の類似事例でも有効であることが多く、使い回しが可能です。

生成AIとWeb翻訳のどちらを使うべきか

では、生成AIとWeb翻訳はどちらを使うのが適切なのでしょうか。
連載を通してお伝えしてきたとおり、それぞれにメリット、デメリットがありました。

生成AIは精度の高い翻訳結果の作成が可能な一方、プロンプトを使いこなすには生成AIごとの特性を見抜く必要があることが分かりました。
多様なジャンルの翻訳対象文に合うように、複数のプロンプトを作成する必要があるかもしれません。
また、精度の高い生成AIの利用には、コスト面での課題もあります。

対して、Web翻訳は原文そのままの翻訳では生成AIに劣ってしまいますが、翻訳対象文の日本語に前処理を加えることで求める翻訳結果を得られるという点では、個別の事例への対応もしやすく、プロンプトを使いこなさなければいけない生成AIよりも、利用のハードルが低いと言えるでしょう。
加えて、ウェブページで無償での利用が可能であることも、Web翻訳利用のハードルを下げる要素と言えます。

このような点から、一概に生成AIとWeb翻訳のどちらが利用しやすいか言うことは出来ず、どのようなシーンでの翻訳を想定しているのか、プロンプトや前処理日本語の作成、ポストエディット(翻訳後編集)に割ける工数、かけられる費用など、様々な条件を踏まえて、どちらを使うべきか決定すべきだと思われます。

これまでの検証を踏まえてまとめると、生成AIとweb翻訳のそれぞれに向いているのは、このような方になりそうです。

おわりに

連載企画<Web翻訳 VS 生成AI翻訳>として3回にわたりお伝えしてきましたが、いかがだったでしょうか。

近年では、生成AIの成長が著しく何かと注目されがちですが、Web翻訳も年々アップデートされており、数年前には訳せなかった表現が訳せるようになっていたりします。
翻訳を取り巻く環境が今後どう変わっていくのか、引き続き注目していきたいと思います。

ここまでお読みいただきありがとうございました。今後ともどうぞよろしくお願いします。