「AI翻訳体験記 -前編-」
本投稿は、パテントサロン様が企画された「知財系 Advent Calendar 2020」の投稿記事となります。また、ある翻訳講座の受講感想を一部修正したものとなります。ご了承下さい。
【はじめに】
早いもので、アッという間に1年間が過ぎ去りました。私は、会社員(半導体エンジニア)として勤務している傍ら、副業で特許翻訳を行っています。昨今、翻訳業界は、AI翻訳の翻訳精度向上の影響もあり、高い翻訳力を身につけなければ、仕事にありつけない状況になりつつあります。そのため、自身を鍛え直す必要性が出てきました。そこで、以前に翻訳の勉強で利用させて頂いた「レバレッジ特許翻訳講座(https://eigo-zaitaku.com/)」の再受講コースを2019年12月に申し込みました。まず鍛えるべきところは、翻訳処理速度の向上です。副業で翻訳に取り組んでいるため、翻訳に投入できる時間が限られています。翻訳案件によっては受けることができないこともありました。処理速度が向上すれば、より多くの翻訳案件を受け入れられ、かつ勉強時間も確保しやすくなるだろうと目論んだ次第です。そのためには、英語や科学・技術の土台の再構築を行う必要性を感じていました。どこかでやり直し、実力の向上を図らなければ、翻訳で稼ぎ続けるのは難しいと考え、レバレッジ特許翻訳講座の再受講を決めました。
さて、再受講を決めた当初は、「AI翻訳」に関しては、それほど意識はしていませんでした。本当に意識していませんでした。そう、講座のあるコンテンツに出会うまでは・・・。現在は、AI翻訳にどっぷり浸かっており、その有効利用を模索しているところです。有効利用とは、商品となる訳文を効率よく作成することです。会社員の業務の一部(というかメイン?)に「業務効率の改善」があるのですが、副業でも同じようなことをやっているのだなぁと、最近、常々思います(笑)。それと、AI翻訳に本格的に手を出しはじめて、新たな出会いもありました。ある方が、私のAI翻訳に関するブログ記事に興味を持って頂き、その方が主催するコミュニティのAI翻訳イベントの講師として招かれたのです。本当に自分で良いのかと戸惑った部分もありましたが、面白そうでもあったので、講師をやらせて頂いた次第です。この「AI翻訳体験記 -前編-」は、このときに私のパートで発表させて頂いたものや、この1年でAI翻訳をいじってきて、見てきたこと、感じたことなどを書いてみました。どうぞ、ご覧下さい。
【AI翻訳サービスを使ってみる - T-tact AN-ZIN】
さて、翻訳処理速度向上の1つの手段として「AI翻訳サービス」を使ってみることが挙げられるかと思います。私は、再受講を開始する前に十印の「T-tact AN-ZIN」を使い始めていたところでした。使ってみた感触として、Google翻訳よりは正確であろうということと、請求項専用エンジンが搭載されていることから、出力される訳文が請求項の様式にしたがって訳されることが良かった点でした。ただ、月間使用文字制限があり、また、訳崩れなどが時折見られ、メインで使うほど精度が良いとは思えなかったため、時折、自身の翻訳に自信が無い部分などに、参考に使ってみるといった程度でした。ですので、当時「AI翻訳で翻訳処理速度を上げよう」といった考えは、ほぼ無かったように思えます。1つ注意点として、「T-tact AN-ZIN」の現在の翻訳エンジンは、当時の翻訳エンジンよりパワーアップしているらしいので、相当使えるようになっているかもしれません。お試しあれ。
このように、最初に手を出したAI翻訳サービスの翻訳精度が目を見張るものではなかったため、それほどAI翻訳に対して大きな関心はありませんでした。とりあえず使ってみて、有効な利用方法を模索している段階であったと記憶しています。そのような中で、AI翻訳への関心をグッと引き寄せたのが、講座コンテンツの、あるビデオセミナーの視聴がきっかけでした。参考として、T-tact AN-ZINの和訳例を以下に載せます。見てみて下さい。
〈T-tact AN-ZIN 和訳例〉
【面白そうなAI翻訳を知る – T-4OO】
再受講開始当初、興味の向くままにビデオセミナーを見ていたのですが、ビデオセミナー3094号「AI翻訳ソフトとのシナジー効果」を視聴して、「これはすごい武器になるかも」との思いが駆け巡りました。
このビデオセミナーには、株式会社ロゼッタのAI翻訳サービス『T-4OO(ティーフォーオーオー)』が紹介されており、何と言っても、『エンジンの学習機能が搭載されている』ところに心惹かれました。つまり、対訳を学習させればさせるほど翻訳精度が上がっていき、翻訳処理速度の向上が見込まれるわけです。簡単に特徴を紹介しましょう。
■ T-4OO〈 URL: https://www.jukkou.com/ 〉
・株式会社ロゼッタが提供。T-4OOは「Translation For Onsha Only」の略称。
・専門分野毎の機械翻訳エンジンを使っている。分野は2000分野から選択できる。
・ユーザー毎に専用データベースが用意されており、用語や対訳を登録することでAIが学習して翻訳精度が向上する。
・インターネット上で使用するサービス。セキュアな環境で利用可能となっている。
・テキスト翻訳、ファイル翻訳、Web翻訳が可能。
・CATツールのような翻訳・校正機能が付いている。
・以前にインターネット上で公開されていた「究極の辞書」は、T-4OOのサービスの一部となっている。
・登録によって学習可能な言語は、英語と中国語となっている。
・用語や対訳を登録することで翻訳精度が向上するが、向上するのは名詞や名詞句だけであり、係り受けは反映されない。
・利用料金は年額制。文字数制限があり、契約プランにより利用可能文字数が異なる。利用料金はそれなりに高価(詳細は伏せさせて頂きます)。
・法人だけではなく、個人でも導入可能。
以上が、T-4OOの特徴となります。はじめてだったかもしれません。AI翻訳で使えそうな訳文が生成されると思ったのは。そして、学習させることでさらに精度があがるのですから、期待大でした。ただ、正直なところ、導入費用の高さに驚きましたが、先行投資と考えて即導入を決めました。実際の出力結果は、後ほど紹介したいと思います。ついでではありますが、他の翻訳サービスもここにまとめておきます。ちなみに、以下に「翻訳メモリ」という用語が出てきますが、これは過去に翻訳した原文と訳文が対になった状態で保存されたデータベースです。つまり、この翻訳メモリを参照しながら訳文を作成することで、翻訳の効率化が図ります。
■ The Reading〈 URL: https://www.rozetta.jp/lp/thereading/ 〉
・株式会社ロゼッタが提供。『T-4OO』のテキスト翻訳・ファイル翻訳に特化した翻訳。
・20種類の翻訳エンジン(機械/IT/建設/自動車/電気/医学/CMC/非臨床/臨床/ライフサイエンス/化学/食品/環境/農業/エネルギー/医療機器/特許/法務/金融・IR・会計/会話・メール)にて翻訳。
・情報漏えい防止のためのセキュリティ体制を構築。
・1ユーザーあたり2480円/月(税別)。月換算で5万文字まで。契約期間は1年単位。最小ユーザー数は3名。
■ Qlingo〈 URL: https://www.top.qlingo.ai/ 〉
・株式会社ロゼッタのT-4OOの汎用エンジンを採用。
・ファイル形式、レイアウト維持したまま翻訳可能。
・エディタ機能により訳文の編集が可能。
・用語集、翻訳メモリ機能を搭載。
・翻訳量・ファイル数無制限。月額9800円。
・文字数制限のある安価なプランもある。
■ Google翻訳〈 URL: https://translate.google.co.jp/ 〉
・誰もが知る翻訳サイト。NMTになってから翻訳精度の向上が見られている。
・翻訳実務に使用するには、翻訳精度は十分高いとは思わないが、エンジンをカスタマイズした場合、分野によってはT-4OO程度に精度が向上すると聞く。
・Espacenetの翻訳機能は、Googleのエンジンを使用しているとのこと。
■ DeepL〈 URL: https://www.deepl.com/home 〉
・昨今話題の翻訳サイト。翻訳精度は高い方である。
・有料版のDeepL Proは、セキュリティ対策が施されている。
・有料版でもテキスト翻訳の使用制限なし。
・文書ファイルの翻訳が可能。原文のフォーマットはそのままに。
・訳文のカスタマイズ機能を搭載。複数の候補から訳文のカスタマイズ可能。
・有料版のAdvancedプラン以上では、CATツールとの連携が可能。
・用語集機能を搭載しているが、日本語はまだ対応していない。
■ ModernMT〈 URL: https://www.modernmt.com/ 〉
・翻訳サイト。
・センテンス単位だけでなく文書単位で適切な訳語で翻訳。
・修正した訳文はリアルタイムで学習され、次の訳文に反映される。
・リアルタイム学習機能、CATツールとの連携は、有料の「Human-in-the-loop」プランにて利用可能。100万文字当たり50ドル。
■ Mirai Translator〈 URL: https://miraitranslate.com/service/miraitranslator/ 〉
・株式会社みらい翻訳が提供するAI翻訳サービス。NICTの研究成果を利用したもの。
・テキスト翻訳、ファイル翻訳が可能。
・用語集機能、翻訳メモリ機能を搭載。
・セキュリティ対策も完備。
・カスタム翻訳エンジンの搭載可能。ただし、エンジン作成は別途料金が必要。
・利用料金は年額制。少なくとも12万円以上かかる。
・残念ながら個人での契約は不可。法人向けサービス。
■ COTOHA Translator〈 URL: https://www.ntt.com/business/services/application/ai/cotoha-translator.html 〉
・NTT CommunicationsのAI翻訳サービス。株式会社みらい翻訳との協働サービス。
・NTTグループの日本語解析技術を活用。
・テキスト翻訳、ファイル翻訳が可能。
・用語集機能、翻訳メモリ機能を搭載。
・セキュリティ対策も完備。
・利用料金は月額制。ただし、最低利用期間は1年間(最初の1ヶ月は無料)。
・最低月額80000円。利用ID数による。
・書籍「人間+マシン AI時代の8つの融合スキル」は、当サービスを利用して翻訳されたとのこと。
・法人向けサービス。
■ Zinrai Translation Service〈 URL: https://www.fujitsu.com/jp/solutions/business-technology/ai/ai-zinrai/translation/index.html 〉
・富士通株式会社が提供するAI翻訳サービス。株式会社みらい翻訳との協働サービス。
・テキスト翻訳、ファイル翻訳が可能。
・用語集機能、翻訳メモリ機能を搭載。
・セキュリティ対策も完備。
・利用料金は月額制。最低利用価格は、165000円/月(30万文字まで)。
・法人向けサービス。
■ みんなの自動翻訳@TexTra〈 URL: https://mt-auto-minhon-mlt.ucri.jgn-x.jp/ 〉
・国立研究開発法人情報通信研究機構(NICT)が開発した機械翻訳サイト。
・利用料金は無料。
・テキスト翻訳、ファイル翻訳、Web翻訳が可能。
・用語集機能、翻訳メモリ機能を搭載。
・ただし、セキュリティは確保されていないためビジネスに利用するには不適当。
■ T-tact AN-ZIN〈 URL: https://to-in.com/lp 〉
・株式会社十印が提供するAI翻訳サービス。みんなの自動翻訳の商用版。
・テキスト翻訳、ファイル翻訳が可能。
・用語集機能、翻訳メモリ機能を搭載。
・セキュリティ対策も完備。
・カスタマイズ翻訳エンジンを作成可能。また、そのエンジンを「翻訳エンジン取引所」にて販売することも可能。
・特許、半導体、リーガルなどのカスタマイズエンジンが公開されている。ただ、T-4OOよりは精度は低いと思われる。
・料金は月額制。ただし、最低利用期間は1年間。
・最低月額20000円/月。利用制限50万文字/月。(個人向けプランもあったはず)
■ みんなの自動翻訳@KI(商用版)〈 URL: https://www.k-intl.co.jp/minna-mt 〉
・株式会社川村インターナショナルが提供するAI翻訳サービス。みんなの自動翻訳の商用版。
・テキスト翻訳、ファイル翻訳が可能。
・用語集機能、翻訳メモリ機能を搭載。
・セキュリティ対策も完備。
・汎用エンジン以外に、専用エンジン(金融、特許、ライフサイエンス、IT)を搭載。
・利用料金は月額制。最低月額20000円/月。利用制限50万文字/月。
・個人向けプランもあり。12ヶ月契約プランで、月額5000円、利用制限50万文字/月。
■ CROSS-Transer〈 URL: http://cross.transer.com/?utm_source=cooporate&utm_medium=slider&utm_campiagn=crosstranser 〉
・株式会社クロスランゲージが提供する無料翻訳サイト。
・ニューラル機械翻訳が搭載されている。
・当社は、機械翻訳ソフト「PAT-Transer」をリリースしている。翻訳精度はともかく使い様によっては便利なツールである。
・月額制の有料翻訳サービスも存在する(プレミアム機会翻訳など)。
■ Weblio英語翻訳〈 URL: https://translate.weblio.jp/ 〉
・weblioが提供する無料機械翻訳サイト。
・です・ます体や、だ、である体の指定が可能。
・英語の音声が聞ける。
・訳文の候補が複数提示される。
・月額300円で広告を非表示に可能。
■ WIPO Translate〈 URL: https://patentscope.wipo.int/translate/translate.jsf 〉
・WIPOが提供する無料の機械翻訳サイト。
・翻訳対象と同一分野を、31種類の選択分野から選択することでより正確な訳文を出力する(と思う)。
・訳文は、複数のパターンを提示。
・日⇒英翻訳は、まだリリースされていない。
■ kode-AI翻訳〈 URL: https://www.kodensha.jp/index/products/kode-ai/ 〉
・株式会社高電社が提供するAI翻訳サービス。
・テキスト翻訳、ファイル翻訳が可能。
・用語集機能、翻訳メモリ機能を搭載。
・セキュリティ対策も完備。
・カスタマイズ翻訳エンジンを作成可能。
・使用料は年額制。最低36万円。月間200万文字まで。
それと、ツール内、特にCATツールのオプションとしてAI翻訳(機械翻訳)が備わっている(連携できる)ものもあります。ちなみに、CATツールとは、「Computer Assisted Translation Tool」(コンピューター支援翻訳ツール)の略称です。勘違いされる方もいらっしゃいますが、「AI翻訳(機械翻訳)」とは全く別物となります。機能としては、翻訳に必要な機能を備えたエディタ、過去の翻訳資産を参照できる「翻訳メモリ」、エディタ上で効果的に表示出来る「用語集」を備えています。その他に、翻訳業務の管理を容易にする機能も備えています。では、見てみましょう。
■ SDL Trados Studio〈 URL: https://www.sdl.com/jp/products-and-solutions/translation/software/sdl-trados-studio/nmt-for-studio/ 〉
・SDL社のCATツール「SDL Trados Studio」のオプション機能『SDL Machine Translation』。
・ニューラル機械翻訳を採用しており、1ヶ月50万文字まで無料で利用可能。
■ Memsource〈 URL: https://www.memsource.com/ja/features/machine-translation/ 〉
・CATツール「Memsource」のオプション機能『Memsource Translate』。
・登録している翻訳エンジンから、翻訳対象に最適なエンジンを選択する機能。
・標準機能として、Amazon Translate, Google Translate, Microsoft Translatorが使用可能。従量制で2000000文字当たり60ドル。パーソナル版は50000文字まで無料で使用可能。
・別途契約が必要だが、API経由にてDeepLなども使用することが可能。
■ memoQ 〈 URL: https://www.memoq.com/jaintegrations/machine-translation 〉
・CATツール「memoQ」のオプション機能として各機械翻訳サービスと連携が可能。
・利用には各機械翻訳サービスとの契約が必要。DeepL、Amazon MT、Google MT、Microsoft Translator、Mirai Translator、TexTraなどを使用することが可能。
■ Japio-GPG/FX〈 URL: https://www.japio.or.jp/service/service05_08.html 〉
・一般財団法人日本特許情報機構が提供する特許検索サービス「Japio-GPG/FX」のAI翻訳サービス(オプション)。
・公報データ、入力されたフリーテキストのAI翻訳機能。
・使用には年間契約が必要。一般向け30000円/月。AI翻訳はその20%。
・追記(2021/1/4):Japio-AI翻訳(無料版)がリリースされました。
⇒ https://aitrans-tiny.japio.or.jp/ (入力制限200文字)
以上となりますが、この他にも様々なものがあるかと思います。いろいろ試してみることをオススメします。
【AI翻訳の問題点】
さて、これらのAI翻訳には問題点がないのでしょうか。ビデオセミナー3420号「MTPEが抱える問題」に、その問題点の一部が紹介されています。題名がMTPEとなっていますが、みらい翻訳を翻訳補助ツールとして使ったときの1つ問題が提示されています。このビデオセミナーは文の係り受けに関する問題を挙げたもので、この係り受けの誤りを見抜くためには、技術内容そのものをしっかりと理解しなければならないと主張されています。(補足ですが、MTPEとは、「Machine Translation + Post Edit」 の略称で、AI(機械)翻訳エンジンで生成した訳文を、人の手で編集して翻訳文を作成することを言います。一から人の手で翻訳する「翻訳」と、「MTPE」は別物として扱われています。)
他には、どんな問題点があるのでしょうか。例えば、「通信翻訳ジャーナル 2020SUMMER 機械翻訳2020」には、以下のような問題点が挙げられています。
〈英日・日英翻訳共通〉
・専門用語の間違い(誤訳、略語の誤判定)
・訳揺れ(文章間で異なる訳語)
・訳漏れ(単語、文章単位、肯定/否定)
・並列関係の間違い
・数字の誤記(日付、数値、参照符号の泣き別れ)
・係り受けの間違い
・単語の繰り返し
・原文にない単語やフレーズが出現
〈英日翻訳〉
・常体と敬体が混在
・英数字記号で全角と半角が混在
〈日英翻訳〉
・単数/複数の間違い
・全角文字が残る
この中で、AI翻訳を利用する上で一番注意が必要なのが、並列関係の間違いと係り受けの間違いであると個人的には考えます。他の項目は、一見流暢な訳文だとしても間違いが判別しやすいものであるか、またはAI翻訳サービスのオプション機能等で解決することが出来るはずです。ただ、先に挙げた2つは、文法的には正しくとも内容的には間違っていることがあるので、判別しにくいと思われます。恐らくは、技術内容を理解できなければ、人間が翻訳するとしても間違いを起こしやすい部分でもあるのでしょう。
では次に、実際にAI翻訳にて英日翻訳した結果を、問題点を交えて見てくこととします。
【AI翻訳の実力検証】
ここでは、私があるコミュニティのAI翻訳のイベントで発表させて頂いたものを元に、AI翻訳の問題点を検証していきたいと思います。使用した特許公報は、WO2018222268です。この特許公報を、Google翻訳、DeepL、Mirai Translator、T-4OO、T-3MTにかけて和訳しました。その中から1つの翻訳エンジンに着目し、公開訳文と比較しながら異なっている箇所に着目して見ていきたいと思います。では、いきましょう。
以上が、各翻訳エンジンで訳した結果です。これらの問題点を如何にして調理するかが、AI翻訳を使いこなすポイントとなります。そのテクニック等は、模索中でありますが、別の機会にご紹介できればと思います。あと、T-4OOの翻訳結果については、最後に掲載しましたのでご覧下さい。
【AI翻訳の使い方】
AI翻訳の問題点を、実際の翻訳結果を交えて見てみましたが、AI翻訳を翻訳実務に活用するにあたって、これらの問題点を見抜かなければなりません。では、実際にどのように活用すべきか。その1つの指針を示しているビデオセミナーが3190号の「MTPEで稼ぐために」になります。
このビデオセミナーでは、AI翻訳が使われているであろうMTPEの活用方法が、以下の様な流れで提案されています。
● MTPEのAI翻訳(機械翻訳)文を参照せずに訳文をつくる
↓
● 訳文の作成には、CATツールや、自身のAI翻訳(機械翻訳)などを使い作成する(注:訳文の作成に何らかのツールを使わなければならないということではない。とにかく、自身で訳文を考えるということ)
↓
● 自身の訳文とMTPEのAI翻訳(機械翻訳)文とを比較する
↓
● 差分を念頭におきながら、訳文を決定する
通常、MTPEというと、AI翻訳(機械翻訳)で生成された訳文の間違いを見つけ出し、修正していくものと想像します。この場合、やってみると分かりますが、自信の翻訳力の向上は、ほとんど見込めないと思われます。単語単位で訳語を比較するばかりで、訳文を作り出すように脳を働かせることはないのではないかと。さらに、間違いが多い場合は、自身で一から訳した方が早いはずです。もっと言うと、AI翻訳の翻訳精度がそれほど高くない場合は、自身で翻訳するよりも時間と手間が一層かかってしまします。そのため、昨今、翻訳上級者ほどMEPEを敬遠する様子が伺えます。
では、AI翻訳を活用しながら、翻訳処理速度を向上させ、さらに、翻訳力の向上が見込める方法はないのでしょうか。それには、まず、ビデオセミナーで提案されているように、自身で翻訳する(訳文を考える)必要があるようです。その上で、AI翻訳の問題点を把握しながら、AI翻訳の差分や癖を念頭に、訳文を作成していくのが最良だと考えています。
そこで、現在、私が実際に行っている翻訳の流れを大まかに示すと、
● T-4OO(AI翻訳)で訳文を生成する
↓
● T-4OOの結果を参照せずに、まずは訳文をつくる(想像する)
↓
● 訳文の作成には、Trados(CATツール)とPat-Transer(機械翻訳ソフト)を使い作成する
↓
● 自身の訳文とT-4OOの訳文とを比較する
↓
● 差分を念頭におきながら、訳文を決定する
このようになります。ある意味、セルフMTPEと言ったところでしょうか。ところで、いったん自身で訳文を作る(考える)ため、翻訳処理速度の向上は見込めないのでは?と疑問に思うかもしれませんが、そんなことはありません。では、どのくらいの向上が図れたのか簡単にご紹介します。
【AI翻訳による翻訳処理速度の向上】
先に紹介しましたが、現在、私が使っているAI翻訳はT-4OOになります。具体的な手順などが定まっていない状態ではありますが、大まかな流れとして、上記のように翻訳したときの翻訳処理速度を測ってみました。翻訳したものは、IT、機械、化学、半導体分野の特許明細書の英日翻訳です。私が所有する翻訳メモリと原文とのマッチ率は、100%はいずれの分野でもほぼゼロ、80%以上のマッチ率でも、良くて2%程度なので、ほとんど一から訳したものとなります。また、得意とする分野の順番は、得意なものから半導体⇒化学≒機械⇒ITの順になります。ちなみに、翻訳業界では、1日に2000ワード程度は処理できる能力が求められていまが、私の場合、その処理能力に達している分野は、半導体関連となります。では、T-4OOを使った翻訳処理速度を見てみましょう。
〈 IT分野(通信アルゴリズム) 〉
・平均処理速度:210ワード/時間 ⇒ 1日当たり約1600~2000ワード
〈 機械分野(通信機器構造) 〉
・平均処理速度:244ワード/時間 ⇒ 1日当たり約2000~2500ワード
〈 化学分野(有機化学製品) 〉
・平均処理速度:257ワード/時間 ⇒ 1日当たり約2000~2500ワード
〈 半導体分野①(微細構造作成プロセス) 〉
・平均処理速度:393ワード/時間 ⇒ 1日当たり約3100~3900ワード
〈 半導体分野②(半導体プロセス材料) 〉
・平均処理速度:366ワード/時間 ⇒ 1日当たり約2900~3700ワード
以上のような翻訳処理速度になります。1日当たりの処理ワード数は、おおよそ1日に翻訳作業に当てる時間が8~10時間となるため、その換算値となります。やはり、分野によって翻訳処理速度にばらつきがありますが、おおむねT-4OOを使わないときと比較すると、2~3割の速度アップがみられました。そのおかげで、機械、化学分野は、初めて見る技術内容であったにもかかわらず、それなりの翻訳処理速度に到達することができ、半導体分野に至っては、さらなる速度向上が見られました。ただ、いくらAI翻訳でアシストされるといっても、あまり詳しくないIT分野の翻訳処理速度は伸びませんでした。それと、もし、翻訳メモリが充実していれば、より一層の速度アップが図られると予想します。T-4OOの個人利用を考えると、利用料金は決して安くはありませんが、2~3割の速度アップが見込めれば、十分に利用する価値はありそうです。
その具体的な利用方法は、より良い方法がないか模索中ですが、また別の機会にご紹介できればと思います。
【翻訳業界に与える影響って?】
ところで、AI翻訳が翻訳業界に与える影響ってあるのでしょうか?私が実際に見聞きしたのですが、ある企業が翻訳会社に依頼した翻訳物を、自社が契約するAI翻訳エンジンに取り込んでいるとのことです。それも積極的に取り込んでいるような雰囲気です。そして、翻訳の外注が大幅に減ったとのことでした。また、ある企業では、特許関連の翻訳に際して、機械翻訳でも差し支え無い部分は、積極的に活用しようとする動きがあるようです。さらに、海外に目を向けると、AI翻訳を使用しているかは定かではありませんが(何らかのツールを使っていそうですが)、海外に出願した外国語の特許明細書を、社内のエンジニアが自国語に翻訳して、特許事務所を通さずに自国の特許庁へ直接出願することもよくあるのだとか。
要するに、翻訳の「内製化」が、徐々に進んでいるようなのです。この「内製化」は、簡単なことではないと思いますが、各企業が自社向けにカスタマイズ可能なAI翻訳エンジンを保有した上で、鍛えられたAI翻訳専門部隊や、AI翻訳コンサルタントの導入を行えば、翻訳会社の出番が少なくなっていくのは必然のような気がします。そのような状況を受けて、翻訳会社の中には、AI翻訳システムの導入支援を行っている企業も見受けられるようになりました。例えば、先に紹介した「川村インターナショナル」などがそれにあたります。
では、翻訳者はどうなっていくのでしょうか。1つ言えるのが、AI翻訳の翻訳精度が年々向上していることから、翻訳の実力が十分に備わっている人でなければ、翻訳の仕事にありつけなくなると想像します。それもかなり上位の実力者しか残らないのではないかと。言い換えると、AI翻訳の間違いに容易に気づけて、教師になり得る者が生き残っていくのではないでしょうか。
【さらなるAI翻訳エンジンの登場】
さて、AI翻訳を利用するときに、一番のポイントとなるのが、「翻訳エンジンがカスタマイズ可能なこと」だと考えています。やはり翻訳精度を求めるならば、個々の分野に特化した翻訳エンジンが、もっとも精度が高いのではないでしょうか。昨今、翻訳精度が良いと話題になっているDeepLは、たしかにこれまでのものと比べて翻訳精度は高いほうだとは思いますが、翻訳分野が選択可能なT-4OOと比較すると、T-4OOの方に軍配が上がる印象を思っています。ただし、そんなT-4OOでも、対訳を学習させて翻訳精度が向上する部分は名詞や名詞句のみで、文の係り受けの精度は向上されません。そこで、文の係り受けや、ニュアンス等を含めて翻訳精度の向上が期待できるAI翻訳サービスが登場しました。それが「T-3MT」となります。
■ T-3MT〈 URL: https://www.rozetta.jp/lp/T-3MT/ 〉
T-3MTに関しては、講座のビデオセミナーの3470号「T-3MTについて」でも、簡単にですが取り上げられています。
特徴としては、
・通常なら膨大な対訳が必要だが、わずか30ページ程度の対訳で、微妙な表現や言い回しまで反映可能な翻訳エンジンを作成できる。
・IT、機械、電気電子、医薬、化学、環境、特許、ビジネス、会話、メールからなる各汎用エンジンでも翻訳精度は高い。
・T-4OOのように名詞や名詞句だけではなく、文の係り受けも学習する。
・T-4OOのように訳文編集機能は存在しない。つまり、使う必要がないぐらい翻訳精度が高いということのようです。
・T-4OOは、2~3割の翻訳処理速度の向上が見込めるが、T-3MTは、5割程度が見込めるとのこと(検証中)。
・利用料金は年額制。文字数制限があり、契約プランにより利用可能文字数が異なる。料金はそれなりに高価(詳細は伏せさせて頂きます)。
・カスタマイズエンジンを作成する場合、他社サービスならば相当高額な費用がかかるようだが、T-3MTはそれに比べて安価(詳細は伏せさせて頂きます)。
・カスタマイズエンジンを作成した場合、エンジン一個につき年額の維持費用が発生する。ただし安価(詳細は伏せさせて頂きます)。
以上が挙げられます。
言うなれば、この「T-3MT」は、カスタマイズエンジンの作成に使用した対訳の細部まで反映するので、自身のコピーが高速で翻訳をすることとほぼ同等になります。ただ、注意しなければならないのは、訳文の細部まで反映してしまうので、もし間違った対訳でカスタマイズエンジンを作成した場合、間違いを反映してしまうことです。さらに、システム上、学習する対訳として不適当なもので作成した場合でも間違った訳文を生成してしまうようです。私も実際にやらかしてしまったのですが、汎用エンジンとカスタマイズエンジンで翻訳結果を比較した際に、不適当な対訳(訳が間違っているというわけではない)でカスタマイズエンジンを作成してしまったがために、カスタマイズエンジンの訳文を大きく崩してしまいました。「T-3MT」は翻訳者にとって大きな武器となる一方で、使い方を誤るととんでもないことになる印象を受けました。
先ほど、「T-4OOのように訳文編集機能は存在しない」「使う必要がないぐらい翻訳精度が高い」と言いましたが、実際は、T-3MTの訳文をそのまま使うことはできません。やはり、修正が必要となります。では、修正が必要な場合は、どのようにすればよいのか?その1つの答えが「Rozetta MEMSOURCE」という統合サービスとなります。
■ Rozetta MEMSOURCE〈 URL: https://www.rozetta.jp/lp/memsource/ 〉
これは、CATツールのMemsourceと、AI翻訳のT-3MTが、APIで連携された統合サービスとなります。T-3MTをCATツールと連携して使うには、今のところ、このサービスしかないと思われます。原文と翻訳メモリのマッチ率が高ければ、翻訳メモリから訳文を作成して、それ以外は、T-3MTの生成文から訳文を作成することになります。さらに、Memsourceの翻訳メモリからT-3MTのカスタマイズエンジンの作成をシームレスに行うことができます。ただし、Rozetta MEMSOURCEを個人で使用するには少々厳しいかもしれません。利用料金が非常に高額なのです。T-3MTの通常の利用料金にMemsourceの利用料金が加算されるのですが、例えば、Memsourceのチームスタート版の利用料金を遙かに超えてしまいます(エンタープライズ版に相当するかと)。便利だとは思うのですが(特に企業等で翻訳を管理するとなれば相当便利なのでは)、個人で使用するには腰が引けてしまう価格です。ですが、CATツールと連携して是非使いたいところです。悩ましい!
【今後に向けて】
AI翻訳の精度向上によって、翻訳業界への影響がますます強くなるように感じます。その1つが、翻訳の「内製化」であると考えています。「内製化」は、翻訳精度の高い「カスタマイズエンジン」と、それを効果的に利用する環境と人材があって、はじめて達成されるのではないでしょうか。少なくとも、
〈 環境面 〉
・操作性の容易な翻訳管理システムを備えたCATツール
・翻訳エンジンがカスタマイズ可能なAI翻訳サービス
〈 人材面 〉
・AI翻訳の癖などに熟知し、AI翻訳を最大限活用できる環境・方法を構築できる人
・AI翻訳の間違いを見抜けて、教師データを自ら作成できる人
以上のようなものが必要なのではないかと思います。つまり、
● AI翻訳による訳文の生成
↓
● 翻訳メモリとAI翻訳文を活用した訳文の作成
↓
● 訳文のチェックと翻訳メモリへの格納
↓
● 翻訳メモリからカスタマイズエンジンの作成
↓
● AI翻訳による訳文の生成
上記のようなループをスムースに、そして的確に回す必要があるのではないかと思います。例えば、「翻訳メモリとAI翻訳文を活用した訳文の作成」の部分は、翻訳対象によっては、必要ないかもしれません。おおよその意味が分かるだけで十分であれば、人による訳文を作成する工程は、必要はなくなります。よって、その場合、「訳文のチェックと翻訳メモリへの格納」も、チェックの入っていない訳文を翻訳メモリに格納することは、後の翻訳作業に悪影響を確実に与えるので、行ってはいけないはずです。ただし、その訳文の中に、翻訳メモリに格納した方が良い文や、カスタマイズエンジンの作成に使用すべき文が含まれているかもしれません。ですので、ある種の分類作業を行い、訳文の作成・チェックするスキームも取り入れた方が良いようにも思えます。このように、ツールとそれを使いこなす人が、「内製化」に必要なのではないでしょうか。
これらを踏まえ、今後は、AI翻訳の更なる理解と、AI翻訳を活用するために必要な翻訳力の向上を図り、『AIとの協働』のためのコンテンツ作りと実戦投入を進めていきたいと思います。そして、いつの日か「AI翻訳体験記 -後編-」としてご紹介できたらと思います!
【参考資料 – T-4OO出力結果 】
「AI翻訳の実力検証」では一部のエンジンのみ紹介しました。ここに、現在、私がメインで使用しているT-4OOの結果を記載します。また、各翻訳サイト/サービス(Google、DeepL、Mirai Translator、T-4OO、T-3MT)で生成した全文の訳文を有料記事として掲載予定です。ご興味があれば、参考にどうぞ。(原文:WO2018222268 / 翻訳文:特表2020-523805)
以上、参考まで!
【翻訳講座の宣伝でーす】
おっと、そうそう、最後に宣伝させて下さい!私が受講した翻訳講座です。「レバレッジ特許翻訳講座(https://eigo-zaitaku.com/)」といいます。
最初にも書きましたが、本投稿は「レバレッジ特許翻訳講座」の受講感想を編集したものになります。この講座は、特許翻訳がメインとなりますが、ツールの使い方、調査の仕方、法律、基礎レベルの物理や化学、ブログ記事などのライティング、ビジネス、税金、書評などなど、この他にも様々なことに言及され、コンテンツ量が膨大です。ビデオセミナーがメインのコンテンツとなりますが、2020年12月3日現在、3735本のビデオセミナーが配信されています(これでも配信を抑えているというから驚きです。。)。もし特許翻訳にご興味がございましたら、オススメする講座となります!
ただし、覚悟は必要かもしれません。まずは、講座へ問い合わせてみて下さい。昔はありませんでしが、今はSkype相談をやられているようです。そこで、しっかりと自身の現状を把握して、進むべき道を選択されることが最良かと思います。もし、講座に関して聞いてみたいことがありましたら、Twitterの「@JidaiTrans」へDMを送って頂くか、私のブログの問い合わせ欄「https://jidai-trans.com/inquiry」にご連絡頂ければ、受講生目線でお答えしたいと思います。
この記事が気に入ったらサポートをしてみませんか?