見出し画像

生成AI×翻訳:AI翻訳事業のリアルを語る


はじめに — 自己紹介と、この記事はなにか

DMMグループの生成AIスタートアップのAlgomaticの中の『Algomatic Global』というカンパニーでCXO兼翻訳事業責任者を務めている、のだかつきです。事業としては、1月から種を撒き始め、昨年半ばから事業責任者に就任し「生成AI × 翻訳」というテーマで事業開発をしてきました。

さて、LLMの登場により、機械翻訳の歴史の中でもかつてない範囲で“AI翻訳が当たり前”になる兆しは高まっています。Google翻訳やDeepLだけではなく、ChatGPTの登場以降、翻訳そのものを再定義する流れが急速に広がっています。

そして、『翻訳×AIって、Google翻訳やDeepLもあるし、LLM翻訳もあるし、そもそもビジネスになるの?』という声も何回もらったかわかりません笑

実はそんな単純な話でも無く、奥が深い領域でやりがいがあるのがAI翻訳領域です。もちろん、想定外の失敗も成功も山ほど経験してきました。本記事では、1年積み上げた“AI翻訳事業開発のリアル”を包み隠さず共有したいと思います。

2年前にChatGPTが登場してから、「翻訳はAIに奪われる」「仕事が消える」といった論調を耳にする機会が格段に増えました。でも実際の現場では、目的次第では、AI翻訳は決して「誰でも使える魔法の道具」ではなく、かといって“仕事を奪う脅威”ばかりでもありません。ポイントは、人間とどうコラボレーション、どんな仕組みやLLM以外も含めたアルゴリズムを構築するかにかかっているんじゃないかと思います。

とくに、エンタメ・ゲームの翻訳を1年間動かしてきた当事者として、僕たちは「本当にAI翻訳が作品の世界観やキャラクターの魅力を損なわずに使えるのか?」を追求してきました。結論から言うと、答えは「98%Yes」。ただし、そのためには思っているよりも難易度が高かったです。ただAIに「翻訳して」と丸投げするだけではだめで、『翻訳者 in the loop』が重要です。

かゆいところに目を配るためにLLM「以外の」エンジニアリングや、時には「人のサポート」が不可欠(つまるところ、翻訳特化のAI Agentの構築をしています)で、純粋なLLM翻訳のポン出しに頼りきりでは乗り越えられない壁があります。けれどもドメインエキスパートである翻訳家とAIが上手く協働すれば、翻訳の可能性はかつてなく大きく広がる。そんな手応えを実感しています。

本記事では、AI翻訳の現場で起きた失敗あるあるや、どんなワークフローで乗り越えてきたのか、そして翻訳の本質や未来像について包み隠さずお話しします。翻訳が本当に終わってしまうのか、それとも別の形へアップデートしていくのか、少しでも興味を持っていただけたら嬉しいです。

コンテンツの魂を守る!動画翻訳事業の立ち上げで見えてきたリアル

私の所属するAlgomatic Globalカンパニーが昨年代表の原田を中心に1月に発足し、最初に立ち上げた事業が動画の翻訳でした。

コロナ禍を経てオンライン動画コンテンツが急増し、字幕翻訳を中心に海外へのコンテンツローカライズのニーズが一気に高まっていたのも追い風でした。それこそYoutubeなどのプラットフォームにも自動文字起こしや翻訳機能が搭載されていますし、更にChatGPTなどの各種LLMアプリケーションが話題になったことで「大量の字幕テキストもさくっと翻訳できるのでは」「若干の調整だけで自然に仕上がるのでは」という期待がAI翻訳に対してあったように感じています。

ところが、実際にお客様の声を聞いてみると想像以上のギャップが次々と判明します。たとえば固有名詞や専門用語が誤訳し続ける問題、映像シーンとの紐づけが甘いまま機械的に訳され、誤訳が多発する問題キャラの個性を無視した一律な訳し方など、単なる文字列変換としてのLLM翻訳では到底カバーしきれない課題に直面していることがわかりました。

例えば、映像翻訳では、とくに場面ごとの空気感や登場人物同士の関係性が重要です。動画から文字起こしをしたテキストだけをAIに投げても、感情表現などの機微重要で、実際のシーンにそぐわない訳文が出やすくなる。キャラクターによって口調を大きく変えたいのに、すべて同じニュアンスで訳されるケースが続出しました。そうしたコンテキストの壁を前に、「AI翻訳はエンタメ領域では結局まだ難しいのか」という声も上がっていました。以下に具体例を挙げてみます。

例:ツンデレキャラのセリフ

原文(日本語)
「べ、別にあんたのためなんかじゃないんだからね!このクッキーだって、ただ余った材料を使っただけなんだから!」

よくある機械翻訳
“I-It’s not like I made these for you or anything! I just used some leftover ingredients for these cookies.”
→ 一応意味は通じますが、キャラクターの “ツンデレ” なニュアンス(照れ隠しの拗ね感)が硬くなりがち。

DMM翻訳の訳例
“D-Don’t get the wrong idea, okay? These cookies? I only made them because I had extra ingredients lying around, got it?”

ポイント
「D-Don’t get the wrong idea, okay?」のように、英語圏のオタク文化でもおなじみの定番言い回しで、ツンデレキャラの照れ隠しのトーンを強調。
文の切り方や口調で、日本語の「べ、別に…なんだからね!」の微妙なハニカミ感を表現。

また、映像領域では「ハコ切り」と呼ばれる描画時間や文字数などのUXも重要視されており、それらも統合して「コンテンツの魂を保つレベルのハイクオリティな字幕翻訳をAIで翻訳するのは難しいのでは?」とされていたように感じています。(もちろんサクッと60点〜70点クオリティを出せるツールはグローバルにも存在していますが、どちらかというと85点〜100点を目指せるところに壁があったように感じました。これが事業開発上のインサイトです。)

ただ、2024年1月からコツコツとお客様の声も聴きながら、翻訳のドメイン知識を持った弊社のスーパーエンジニアとR&Dを重ね、「事前にルールやコンテキストをしっかり学習する仕組みを構築することで、コンテキストを保持した自然な翻訳、つまり90点レベルの翻訳が可能だ」という手応えを得ました。(私が翻訳の事業責任者を引き継いだのは2024年6月?あたりであり、上記はそれより前の話です。具体的にはPodcastでも語っております⏬️)

そうして、正式に立ち上がったのが、1つ目の翻訳サービスであるDMM動画翻訳です。

このサービスをリリースしてからわかってきたことは、かゆいところに手が届くきめ細やかなエンジニアリングや人のサポートをかけ合わせることで、かつてないコストや速度で高品質なエンタメ翻訳は実現出来る、そして、それが求められているということです。

この、コストと速度に革命をもたらすのは何を意味するか?という点の解像度を上げると、単にコストカット文脈だけにとどまりません。

むしろ、コスト観点でこれまで「翻訳に挑戦したことなかった」クライアントが翻訳に挑戦出来るようになるという新規市場の創出、デリバリー速度が上がることで運用上数に限りのあった翻訳コンテンツの数を、一気に増加するという攻めの投資の拡大、というイノベーションを意味しています。

つまり、翻訳コンテンツのアウトプット・アウトカムの双方のボリュームを拡大することが可能になったのです。

動画翻訳のアセットを転換し、ゲームの翻訳へ

動画翻訳で見えた「雑にLLMに翻訳を投げると破綻するが、きめ細かいアプローチをかけ合わせることで、速くて安く、良質な翻訳は実行可能になる」という教訓を、更にこれまた別のお客様の声を元に、僕たちはゲームの翻訳にも応用してみました。ゲームの翻訳は映像同等に、いやもしかするとそれ以上に更にハードルが高いです。

数十万〜数百万文字に及ぶ膨大な文字数や複雑な分岐シナリオ、キャラ設定の濃さ、IPの統一感など、非常にクリエイティブな翻訳が求められるのがゲーム翻訳の特徴です。(ゲーム翻訳のツラミは下記記事など読むと解像度が上がります)

キャラクターごとの口調や物語の世界観を保ったまま訳すには、相当きめ細かな対応が必要。だからこそ、ここに生成AIソリューションを導入できれば開発スケジュールやコストが一気に改善し、多言語展開の大幅な拡充が期待できると感じました。

翻訳スピードが変われば原文のシナリオライティングにより時間をかけられますし、1言語あたりの翻訳コストが下がれば、例えば日英中に閉じない幅広い、FIGS+P・アラビア語・ヒンディーなど挑戦したくとも出来ていなかった言語への挑戦も可能になり、よりコンテンツの売上を上げるチャンスが拡大する、というストーリーです。(ちなみにFIGSPキャンペーンもやってます笑)

実際にゲームの翻訳をやってみると、動画と同様の問題がさらに複雑化して現れました。ゲームのテキストはExcelや独自スクリプトなどでバラバラに管理されていたり、フォーマットも独特であったり、ファンタジー用語の造語が連発したり、リリース後も追加シナリオが更新され続けるため、継続的なイテレーションが必須になるなど、ゲームの開発側・ローカライズや翻訳チーム双方にとって、悩ましい課題が山積みでした。

これまた最初は無理かと思っていたゲームの翻訳も、スーパーエンジニアと翻訳家とゲーム開発経験者の知見を抱えあわせ、動画翻訳のノウハウをより深化させようと奮闘した結果、世界観情報やキャラ情報などをAIに学習させるといった新たな仕組みが生まれます。そうして、8月にリリースをしたのが、DMM GAME翻訳です。

DMM GAME翻訳 Webサイトより抜粋

翻訳結果をよりよくするためには、「翻訳作業そのもの以外の周辺領域」にも目を向ける必要があります。例えば、用語集の取り扱いや、スタイルガイドの遵守、翻訳結果の監修、LQA、などなど。

周辺領域でもさらに用語リストやスタイルガイドをクラシックな自然言語処理も用いながら自動生成し、人間がそれを最終チェックしてからAIに教え込む体制を作ると、固有名詞の取り扱いがぐっと安定するなど、地道な改善を積み重ねて来ています。(まさに、翻訳AI Agentの構築です)

リリース直後からお客様にも恵まれ、早速実績として 50万字、100万字、それ以上、といった膨大なテキスト量でも、最初の納品を1週間程度で仕上げるようなケースが出てきています。また、その修正率も0%に近いものすら出てきています。ちなみに平均するとすると大体5%くらいの修正率です。
つまり弊社のAI翻訳がそのままゲームに実装され、世の中にリリースされ始めています。本当に感動です。お客様の皆様ありがとうございます!!

期限に追われてヒヤヒヤする状況が緩和され、クライアントからも「大幅なコストダウンとスケジュール圧縮ができた」という評価をいただいています。動画翻訳で培ったエンジニアリング・プロンプト設計・人間のフィードバックの融合が、ゲーム翻訳でも大きな手応えを生みだし始めているているのです。

ただ、ここまで書くと「結局AIばっかりで、翻訳家を初めとした人間全然出てこないじゃん」とも見えかねない気もしてきたので、より具体的なワークフローにも触れて行きます。

具体的なワークフローと『翻訳家 In the loop』の工夫

「キャラクターの世界観まで崩さないAI翻訳」は、単にLLMに訳させて人間が軽く整えるだけでは成り立ちません。ここでは、その具体的なワークフローをざっくりと紹介します。

まず、クライアントとの要件定義とヒアリングを行い、作品やゲームで重要となる設定や用語の策定、キャラクターの口調や世界観を明確にします。たとえばファンタジーの世界なら「王国と呼ぶのか、領土と呼ぶのか」「現代的ファンタジーな世界観なのか?学園ものか?」といった具合に、最終的に求められる翻訳のゴールをはっきりさせるわけです。早速ここで翻訳家やプロジェクトマネージャーといった人の介在が必要です。

また、ゲームの開発データは翻訳を目的としたデータという意味ではほぼほぼ構造化されていなく、かつ多岐に渡るのも先述の通り特徴です。つまり、翻訳作業を実行するLLM目線でわかりやすい「データの構造化」も、人の手が必要な領域です。多岐にわたるゲーム開発のデータをよく知ったPM(つまり人)が依然として必ず必要になってきます。

さらにさらに、過去の翻訳データなども学習させながら弊社の汎用的なゲーム翻訳AIを「ゲームタイトル専用翻訳AI」として構築していくわけです。

そのうえで、AIに「作品独自のルール」を事前に教え込む作業をします。ざっくりいうとプロンプトエンジニアリングです。キャラクターの性格や口調、タブーとしたい表現などを細かく指定し、案件ごとに最適化していきます。この、翻訳プロンプトエンジニアリングにも翻訳家やゲームのシナリオライター経験者が入ることで、案件ごとにクオリティを高めてます。(つまり、人です)

ここまできたらやっと(といいつつ数営業日あたりですが)AIに翻訳させ、用語や文体ブレをチェックするAgentがチェックし、人間が最終的な演出面の監修を行うという流れになります。また、監修はクライアント・弊社どちらが行う場合もあります。

最後に、クライアントからのフィードバックや追加要望を元にAI翻訳をリテイクし、その情報を元に再度AIをチューニングすれば、だんだんとブレや誤訳が減っていく仕組みが完成します。これをAIだけではなく、『人間+AI』で回すのは、キャラや世界観の表現に柔軟に対応するため。汎用的なルールや運用やプロンプトをがっちり固定してしまうと、微妙な演出調整ができなくなるので、『翻訳家 in the Loop』が欠かせないわけです。

ここまでで「LLM翻訳単体だけでは不十分だけど、上手く使えばスピードとコストを圧倒的に下げられる」という全体像がおわかりいただけたかと思います。「AI翻訳」と一言で言っても、純粋なLLM翻訳の限界を超えて“人らしい翻訳”に到達するためには、クラシックな自然言語処理やアプリケーションレイヤーのエンジニアリング、それに翻訳ドメインエキスパートの演出力を合わせた「総合格闘技」的アプローチが必要だと感じています。

ローカライズを超えるエンタメ領域でのAI活用へ

翻訳だけで見ても、ゲームや映像以外にも、コミックやライトノベルなどキャラクターの内面描写が重要なジャンル、あるいはバーチャルライブやSNS発信など、エンタメの周辺には無数の翻訳ニーズが眠っています。

僕たちが描くビジョンは、単に安く速く訳すのではなく、言語の壁で諦めていたコンテンツをグローバルへ届け、海外のファンが自分の母国語で自然に楽しめる環境を当たり前にすること。そのために翻訳者が果たすべき役割はまだまだ大きく、AIによって簡単に置き換えられるものではないと確信しています。

そして、これまで翻訳を中心に語ってきましたが、「翻訳」の枠を超えて、AI×エンタメの協働はさまざまなクリエイティブに応用できるはずです。

ゲーム業界という意味では、翻訳のみならず、シナリオライティングやAIボイス、イラスト生成のように、もはや翻訳を通り越して「創作そのもの」をAIと分担する時代も確実に進んできます。いわば“AIネイティブなゲーム開発”の流れが進んで来ています。

(そんな流れで、、、、余談ですが、翻訳を皮切りにゲーム業界へ入っていった我々、「DMM GAME翻訳 事業部」として動いてきたわけですが、今日から「AI GAME STUDIO」事業部としてサービス提供範囲を翻訳以外にも広げて行く意思決定をしました。グローバルにゲーム開発を支援するチームとして更に拡大をしていきます!!)

翻訳は“終わる”のではなく“アップデート”される

ここまで「生成AI × 翻訳」を巡る取り組みをお話ししてきましたが、一番お伝えしたいのは、翻訳という仕事が決して「終わる」わけではないということです。むしろ、AIとの協働によってスピードとスケールを拡大しながら、人間が担う創造的な部分が明確になり、翻訳そのものがアップデートされる局面に来ているのではないでしょうか。(他のあらゆる仕事がそうですが)

SNSなどでは「AIが翻訳を奪う」という論調もよく見かけます。でも、実務の現場から見ると、AIはそれ単体ではまだまだ求められる翻訳に至らない場合も多いです。人間はキャラクターの演出や世界観の調整など創造的な領域により専念しながら、AIと協業する、新しいAI翻訳の時代が生まれつつあります。どちらかが不要になるのではなく、両者が掛け合わさることで翻訳という仕事の境界が広がっていくのです。

私たちの次のステップは、翻訳のクオリティを更に高めること、それから、更に翻訳の枠を超え、シナリオライティングやAIボイスのような領域へ展開を進めることです。単なる翻訳サービスではなく、「ゲーム開発×海外展開を加速するAIプラットフォーム」のような形で、クライアントが言語の壁を意識せずにコンテンツを届けられる世界を目指しています。ちなみにそこでは、翻訳者が「文字を置き換える人」ではなく「コンテンツの海外演出をAIと共にディレクションするクリエイター」に近い立場へ進化していくでしょう。

つまり、翻訳とは、単に言語Aから言語Bへ文字を変換する作業ではなく、キャラクターや物語の魂を異なる文化圏へ届けるクリエイティブディレクションとも言えます。AIは「速さ」や「大量処理」に優れ、人間は「コンテキストの注入と最後の5%の演出」を得意とする。この両者が力を合わせることで、これまで不可能と思われていたようなスケールのローカライズが日常になりつつあります。言語の壁がなくなる未来を一緒に作っていきましょう!

もしこの記事を読んで、「AI翻訳を試してみたいけど不安がある」「キャラ重視の作品だけれど短納期が求められる」「AI時代に翻訳者として新しい役割を作りたい」など、何かピンとくるものがあったら、ぜひ気軽に声をかけてみてください。私のX や 採用サイト や DMM GAME翻訳お問い合わせフォーム などからコンタクトを取っていただけると嬉しいです!!


いいなと思ったら応援しよう!

Katsuki Noda
よろしければサポートお願いします!集まったお金でいい記事を書くための書籍を買いまくります。