見出し画像

プロ翻訳者が教える、ChatGPTを使用したAI翻訳プロンプトのコツ


翻訳者とAI翻訳

こんにちは、私は現在フリーランスの翻訳者として仕事をしています。プロの翻訳者は得意な分野を持っていることが多いのですが、私は医学・薬学分野の翻訳(医薬翻訳)が専門の翻訳者です。通常翻訳と言ったら英語を日本語にする和訳が多いのですが、私の場合は主に日本語の原文を英語にする英訳を行っています。

私が専門とする医薬翻訳の分野では製薬企業のお客さんが多いのですが、ここ数年は機械翻訳(Machine Transltion)の使用が進み、一から翻訳するのではなく、機械翻訳が出力した翻訳結果を修正するポストエディットという仕事が発生しています。ポストエディットを仕事にする人はポストエディターと言いますが、最近はこの仕事が国内・海外ともに増えています。私も医薬翻訳者ですが、ポストエディットの仕事もかなり請け負っています。

近年使用されてきた機械翻訳はニューラル機械翻訳といい、2016年にGoogle社がGoogle翻訳に組み込んだことで、翻訳精度が大幅に向上し、実務上の使用に耐えられる品質にりました。さらに、2017年にはドイツのスタートアップであり、現在はユニコーン企業のひとつとなっているDeepL社もニューラル機械翻訳のサービスを開始しました。この時から、ニューラル機械翻訳は急速に広がっていました。

そして2022年11月、OpenAI社が大規模言語モデル(LLM)であるChatGPTをリリースしました。これまでのニューラル翻訳では、原文が複雑な場合は訳抜けしたり、文が意味をなしていないことが多かったのですが、ChatGPTはある程度これらの問題があっても翻訳をすることができます。さらに翻訳の修正や文体変更など単純な翻訳以外のタスクがこなせるようになりました。

私はここ数年、通常の翻訳とポストエディットの仕事をしていましたが、自分の仕事の中ではポストエディットの仕事の割合が増えています。これまでのポストエディットはニューラル機械翻訳を使用していました。昨年頃から、漫画の翻訳で大規模言語モデルを使用した翻訳のポストエディットも始まっているようです。今後この仕事がどう変わっていくかはまだ分かりません。

また一方で、従来の人手翻訳の仕事も依然としてかなりあるようで、ポストエディットを全くしない翻訳者も多いです。(むしろ、ポストエディットの仕事が増えている私は少数派かもしれません。)最近は海外企業がLinkedinや翻訳者のディレクトリを使用して直接コンタクトを取ってくることも多く、仕事が多様になっています。

昔から翻訳業界には、「機械翻訳で翻訳者の仕事が無くなる」と言われているようですが、実際に機械翻訳で失業した翻訳者がいるのかどうかは定かではありません。国内の翻訳市場は、グローバル化が進むにつれて成長しているようであり、仕事の忙しさの体感とは合っていると思っています。

私の考えとしては、AIは面白いツールなので、使用できる場合は使用していきたいと思っています。(基本的に、翻訳会社は翻訳者がAI翻訳を使用することを禁止していることが多いです。)また、ChatGPTなど生成AIによって、一般の方でもプロ翻訳者に近いレベル(今後はプロが負けてしまうかも)で翻訳できるようになっています。今後は、翻訳というものは翻訳者に頼むだけではなく、翻訳を必要としている人が自分で翻訳をすることになると思っています。

翻訳者としては、仕事が来なくなったら残念です。しかし、AIによって情報を必要としている人に情報が届いたり、言語の壁を越えてコミュニケーションが進むことが達成できれば、それはもともと翻訳者が提供したいと思っている価値そのものです。翻訳者が翻訳できる量には限界がありますが、AIはほぼ無限に翻訳ができます。そのため、翻訳者のキャパシティでは対処しきれない膨大な翻訳をAIが行ってくれていると思っています。よって、一般の方にぜひAIを使いこなしてどんどん翻訳をしてほしいと思います。それが、今回のプロンプトのコツを書いた記事の目的です。自分で翻訳をしていただいて、それでも対応できないことが発生すれば、その時に翻訳者にお仕事をご依頼いただければと思っています。

プロンプトの基礎

前置きが長くなりましたが、ここからChaTGPTを使用して翻訳する際のプロンプトについて説明します。適切なプロンプトを書くことをプロンプトエンジニアリングといいます。プロンプトエンジニアリングの定義については以下のように説明されています。

プロンプトエンジニアリングとは

「AI(人工知能)から望ましい出力を得るために、指示や命令を設計、最適化するスキルのことです。ChatGPTなどの生成AIを使いこなすために注目されるようになりました。生成AIは、命令(プロンプト)の出し方によって、出力されるコンテンツの質が大きく異なるため、より適切なものを入力するスキルが求められています。」

NRI ナレッジ・インサイト用語解説より引用(https://www.nri.com/jp/knowledge/glossary/lst/ha/prompt_engineering

それでは、翻訳時に使用する基本的なプロンプトをご紹介します。とてもシンプルなのですが、同じ構造を維持したまま後述する説明するプロンプトのコンポーネントを変えることで、翻訳以外にも使用することができます。尚、今回のプロンプトはGPT-4oの使用を前提としていますが、無料版のGPT-3.5でもある程度近い翻訳結果が出力されます。



プロンプトの例

あなたはプロの医薬分野の翻訳者です。以下の英語論文を日本語に翻訳してください。対象読者は医師などの医療従事者です。翻訳結果のみ出力し、説明は不要です。

[原文]
"""
ここに原文を入れる
"""


プロンプトのコンポーネント

プロンプトの書き方は様々なものがあります。今回は、プロンプトをコンポーネントに分ける方法をご紹介します。Googleでもこの書き方を以下のガイドラインに記載しています。
(Prompting guide 101: https://services.google.com/fh/files/misc/gemini-for-google-workspace-prompting-guide-101.pdf

このガイドラインでは効果的なプロンプトを書くポイントとして、4つのコンポーネントに分ける方法を紹介しています。このコンポーネントは、(1)役割(Persona)、(2)指示(Task)、(3)背景情報(Context)、(4)出力形式(Format)となっており、この方法に沿って説明します。

上記の例文プロンプトは4つのパートからなっています。それらに一つずつ番号を付けて再度説明します。

(1)役割(Persona) - ①あなたはプロの医薬分野の翻訳者です。
(2)指示(Task) -  ②以下の英語論文を日本語に翻訳してください。
(3)背景情報(Context) - ③対象読者は医師などの医療従事者です。
(4)出力形式(Format) - ④翻訳結果のみ出力し、説明は不要です。

コンポーネント(1)役割(Persona)

①あなたはプロの医薬分野の翻訳者です。

まず、ChatGPTに役割を与えます。ここでは、医学・薬学分野の翻訳者としての役割をChatGPTに与えています。ほかにも役割は以下のように何でも与えることができます。


役割の例

  • あなたはプロのマーケティング翻訳者です。

  • あなたはゲーム翻訳者です。

  • あなたは翻訳レビュアーです。

  • あなたはテクニカルライターです。

  • あなたはローカライゼーションスペシャリストです。


コンポーネント(2)指示(Task)

②以下の英語論文を日本語に翻訳してください。

次は指示(タスク)を生成AIに指示します。ここでは、英語の論文を日本語に翻訳するするよう指示しています。この指示の部分がプロンプトのメインとなるパートであり、翻訳以外でも、翻訳レビューであったり、メール文を書いてもらったり、文章の要約であったり様々な指示ができます。


その他の指示の例

  • 以下の治験実施計画書を英訳してください。

  • 以下のマーケティング資料を日本語から英語に翻訳してください。

  • 翻訳した文書の正確さを確認してください。

  • ~に関する英文メールを作成してください。


コンポーネント(3)背景情報(Context)

③対象読者は医師などの医療従事者です。

3つ目のコンポーネントは背景情報(context)です。翻訳する場合は、読者を指定すると、読者に合わせた文体で翻訳してくれます。この例文では、医療従事者とすることで、用語などがプロ向けの専門用語を使用したり、固い文体で翻訳してくれます。患者向けの文体を指示すると、一般人向けにやわらかくやさしい文体になります。そのほかにも、翻訳が必要な理由、翻訳の目的、その他の背景情報を入れるとそれにふさわしい文にしてくれます。


背景情報のその他の例

  • 対象読者は患者およびその家族ですので、分かりやすい表現を使用してください。

  • 対象読者はウェブサイトの決済システムを開発するソフトウェアエンジニアです。

  • 営業会議で使用する文書です。

  • 翻訳の目的は新しいセキュリティシステムについて従業員に教育することです。


コンポーネント(4)出力形式(Format)

④翻訳結果のみ出力し、説明は不要です。

最後の4つ目は出力形式(Format)です。ChatGPTは通常、回答する際は説明をしゃべり出します。この例文では、訳文だけを回答し、説明は不要であることを指示しています。他にも、出力形式として、表形式、文字数、箇条書き、回答を3つ提示する、ファイル形式(excel、jsonファイル)など、様々な条件付けができます。


その他の出力形式の例

  • 文体は、常体「である調」にしてください。

  • 表形式で要約してください。

  • 500文字で要約してください。

  • 箇条書きでまとめてください。

  • 回答は3つ提示してください。


その他のプロンプト上のポイント

文体のサンプル文を与える

翻訳文を特定の文体にしたい場合は、""" """で区切ってサンプル文を与えることで、ある程度サンプル文に合わせた文体で翻訳が出力されるようになります。


プロンプトの例 (コンポーネント出力形式の部分)

以下のサンプル文に合わせた文体にしてください。

[サンプル文]
"""
サンプル文
"""


※上記のように生成AIにタスクを命じる際に、回答の例を提示することが有効です。1つ提示するのがOne-Shot Prompting。複数提示するのがFew-Shot Promptingといいます(1つも回答例を提示しないのは、Zero-Shot Promptingといいます)。

プロンプトの長さについて

一般的に、長く複雑なプロンプトを書いた方が凄そうに見えます。しかし以下の論文によると、プロンプトはあまり長くしないほうがよいそうです。この論文では、同じタスクを行う場合は、プロンプトは短いほうが正確性が高まるという結果が報告されています。
指示に無関係な情報は記載せず、簡潔に書くことが必要です。

Same Task, More Tokens: the Impact of Input Length on the Reasoning Performance of Large Language Modelsより転載(https://arxiv.org/abs/2402.14848)

その他

  • 指示は具体的・簡潔に書く(目的や出力形式など)。あいまいな指示はその通り出力される。キーワードを入れる。回答例を提示する。

  • 指示にできるだけ「~しない」を入れない。指示を入力する際は「~しないでください(what not to do)」ではなく「~してください(what to do)」にする。

  • 「""" """」、「---」、「#」などを使用して指示と入力値を分けることで、LLMが指示を正しく理解しやすくなる。 例:"""原文"""

ChatGPTの使用の注意点

使用の注意点-①セキュリティ

デフォルトでは、ChatGPTに入力したデータは、モデルのトレーニングに使用されます。

When you use our services for individuals such as ChatGPT or DALL•E, we may use your content to train our models.
訳:ChatGPTやDALL•Eなどの個人向けサービスをご利用時は、コンテンツをモデルの訓練に使用する場合があります。

OpenAIウェブサイト:How your data is used to improve model performanceより引用(https://help.openai.com/en/articles/5722486-how-your-data-is-used-to-improve-model-performance)

入力データのトレーニングをしないようにする設定

「設定」→「データコントロール」→「すべての人のためにモデルを改善する」をOffにする。
※時々画面表示や内容が変わるのでご確認ください。

右上のアイコンをクリックして設定画面に行く
「データコントロール」→「すべての人のためにモデルを改善する」をクリック
モデルの改善をオフにする

※設定でデータを学習に使用しないようにしても、不正利用の監視のため、OpenAIはチャット履歴のデータを30日間保持するそうです。(参考:https://help.openai.com/en/articles/7730893-data-controls-faq)

ChatGPTの使用の注意点-②ハルシネーション

Halucinationとは
人工知能がもっともらしく事実に基づかないご情報を出力すること。

ChaTGPTをはじめとするLLMはテキスト生成時、確率値に基づき次に出てくる言葉を出力します。出力結果は必ずしも正しいとは限らないため、出力結果の内容はよくご確認下さい。LLMでの翻訳も、これまでのDeepLやGoogle翻訳と同様に、訳文の質は原文の質にも依存します。そのため、誤訳や訳抜けなども発生します。翻訳業務では、翻訳した訳文が原文と合っているかどうか、逆翻訳(バックトランスレーション)で検証することがあります。例えばChatGPTで翻訳した原文と訳文をGoogleのGeminiやDeepLなど他のAI翻訳システムででバックトランスレーションをしてみることで、ある程度翻訳結果の検証ができます。

最後に

今回は、ChatGPTを使用して翻訳やそれに関連するタスクを行う際のポイントをまとめました。翻訳の背景や条件を適切にプロンプトに入れることで、ChatGPTをはじめ生成AIの翻訳はかなりのレベルで行うことができます。これを利用して、海外の様々なサイトを見たり、ブログを英訳して海外に公開したり、様々な情報収集と発信にAI翻訳を使っていただければと思います。

参考文献

・OpenAI Prompt engineering https://platform.openai.com/docs/guides/prompt-engineering

・Google Workspace Blog
https://workspace.google.com/blog/ai-and-machine-learning/welcome-to-beyond-the-prompt?hl=en

・Gemini for Google Workspace
https://services.google.com/fh/files/misc/gemini-for-google-workspace-prompting-guide-101.pdf

・三浦 由起子. ChatGPTはメディカル翻訳にどう使えるか. AMT 2023, Tokyo公募セッション資料
https://aamt.info/wp-content/uploads/2023/11/AAMT%E5%B9%B4%E6%AC%A1%E5%A4%A7%E4%BC%9A2023_%E9%85%8D%E5%B8%83%E8%B3%87%E6%96%99_%E4%B8%89%E6%B5%A6%E6%A7%98.pdf

・山田優. ChatGPT翻訳術 新AI時代の超英語スキルブック. アルク
・大規模言語モデルを使いこなすためのプロンプトエンジニアリングの教科書. マイナビ出版.



いいなと思ったら応援しよう!