見出し画像

「Europa Universalis: The Price of Power」日本語化プロジェクトとChatGPTの活用方法         Part 4英文テキストの抽出と翻訳方法


Part 4-1: 英文の抽出方法について

翻訳を始めるにあたり、まず説明書の英文を抽出するために、以下の方法を行っています。

  1. 説明書をスキャン

  2. スキャンデータをPDFからJPEGへ変換

なぜJPEGに変換するのか?
ChatGPTでデータを抽出する際、PDFは直接読み取れないためです(最新バージョンでは対応しているかもしれませんが)。また、JPEGに変換することで、画像編集がしやすくなるという利点もあります。

  1. 説明書のスキャン
    コンビニのコピー機でも、自宅にあるプリンターでも使用できます。例えば、私が使っているのはブラザーの「DCP-J577N」です。8年前の機種ですが、画像スキャン機能があり、問題なく使用できます。
    DCP-J577Nの詳細はこちら

  2. PDFからJPEGへの変換
    PDFデータは「I Love PDF」で簡単にJPEGに変換できます。
    I Love PDFのリンクはこちら

Part 4-2: データの抽出方法について

抽出したJPEGデータをChatGPTに読み込ませる方法は以下の通りです。

  1. データの分割
    まとめて抽出したデータを小分けにして、ChatGPT 4.0に画像を直接貼り付けます。複数の画像を同時に処理できます。



画像として取り込んだデータはトリミングなど「編集」可能


編集したデータ


CHATGPTには複数貼り付け可能

2.文字の抽出:ChatGPTが画像から文字を抽出し、そのまま翻訳も可能です。


英文が抽出されるのでこれを


翻訳するように指示


すると翻訳されたものが出てくる。ただし100%信用できるかは確認が必要

3.翻訳結果の整理
翻訳したテキストをExcelに入力し、ゲームで使用するカードや説明書に反映させます。


翻訳された日本語は、Excelに張り付けた画像に転記


ただし、ChatGPTを使う際には「ゆらぎ」と呼ばれる現象が発生することがあり、生成されたテキストの精度が一定でない場合もあります。この点については、次回詳しく説明します。

いいなと思ったら応援しよう!