
英語論文を読むときに便利なツール
みなさん、こんにちは。ALIFE研究者の岡瑞起です。
私の研究室では毎週一回のゼミで論文紹介という時間を設けています。研究室メンバーが交代で各自の研究テーマに関連している数本の論文を選んで紹介するという内容です。
「自分の研究テーマに関連ある論文をどう探したらいいのか?」というのはよく学生さんから聞かれる質問です。論文の探し方については以前に書いたnoteにもまとめてあります。よかったら参考にしてください。
そして、もうひとつ学生さんからよく聞かれるのは「英語が苦手なのだが、論文を読むときはどうしたらいいか?」という質問です。
最近はAIによる翻訳技術が飛躍的に発展したため、英語が苦手でもAIツールの助けを借りて読み進めることができます。私も良く使っているのがDeepLという翻訳アプリです。
ただ多くの論文はPDFファイルで配布されているため翻訳アプリを使うにはテキストをコピペしてDeepLに貼り付けるという作業が必要です。DeepLにもPDFファイルをアップロードするとまるごと翻訳してくれる機能はついているのですがレイアウトが崩れ非常に読みにくくなってしまいます。
フォーマットを崩さずにPDFファイルごと翻訳してくれるソフトが無いものかと思っていたら、数ヶ月前にReadableというPDFのレイアウトを日本語訳してくるサイトが登場しました(@joisino_さん作)。Twitterでも話題になっていたので使ったことがある方も多いかもしれません。
PDFをアップロードして「DEEPLを開く」ボタンを押すと、PDFから抽出された英語のテキストが表示されます。日本語訳されたテキストを「翻訳結果をペースト」と書かれたテキストボックスにコピペします。最後に「送信」ボタンを押すと、「日本語PDF」ファイルと「日本語と英語が交互に見開きに表示されているPDF」が作成されるのでダウンロードします。

たとえば、「Differentiable Programming of Reaction-Diffusion Patterns」というALIFE国際会議2021で発表された反応拡散系のシステムに関する論文PDFは次のような日本語版PDFが作成されます。


このように非常に綺麗にレイアウトが保たれたPDFが作成されます。日本語になっていると論文を読むハードルも下がった気がしますね。
ただ注意も必要です。DeepLによる機械翻訳はその分野にチューニングされているわけではないので、専門用語などはきちんと訳されないことが多いです。また訳そのものもよく間違っています。DeepLアプリ上で訳しながら読んでいるときは、なんか変だなと思ったら、別の訳を試してみるということができるのですが、PDFになっているとそうはいきません。
たとえば、論文の最初の段落の原文と日本語訳をみてみましょう。
Multicellular organisms build and maintain their body structures through the distributed process of local interactions among tiny cells working toward a common global goal. This approach, often called self-organisation, is drastically different from the way most human technologies work. We are just beginning to scratch the surface of integrating some of nature’s “best practices” into technology.
多細胞生物は、共通のグローバルな目標に向かって働く小さな細胞間の局所的な相互作用の分散プロセスを通じて、その 身体構造を構築し維持する。このアプローチは、しばしば自己組織化と呼ばれ、ほとんどの人間の技術が働く方法とは大きく異なっています。私たちは、自然界の「ベストプラクテ ィス」を技術に取り入れることに、ほんの少し抵抗を感じているに過ぎないのです。
最初の2文はいいですが、3つ目の文は「We are just beginning to scratch the surface of・・・」という箇所を「私たちは、・・・ほんの少し抵抗を感じているに過ぎないのです」と訳してしまっています。抵抗を感じているのではなく、「私たちは、自然界の「ベストプラクティス」をテクノロジーに取り入れるための、ほんの一歩を踏み出したに過ぎないのです。」などと訳した方が正しいです。
他にも日本語に訳された文章だけを読み進めていってしまうと、意味が取りにくかったり、間違って理解したりしてしまう箇所がたくさん出てきます。ですので、日本語で読む場合も原文と照らし合わせながら読み進めていく必要があります。
というように、論文を読むときに英語の能力は必要になってくるのですが、10年前の単語レベルで翻訳して意味を読み取ろうとしていた時代に比べると格段に機械翻訳技術は向上し、便利なツールも整ってきているのは間違いありません。近い将来、それぞれの分野に特化した機械翻訳エンジンが整備されていくかもしれません。あるいはもっとインタラクティブに論文を読んでいて分からない箇所について説明を加えてくれるようなAIの登場を予感するツールも登場しはじめています。
たとえば、explainpaper というサイトに論文をアップロードすると、ハイライトした箇所を説明する文章を表示してくれます。
It's here!
— Aman Jha (@amanjha__) October 24, 2022
Upload *any paper* to Explainpaper and start instantly getting explanations! Ask follow up questions if you need a more in-depth answer.
Go to https://t.co/C7rp4Vj9RS and go read all the papers you've been saving! 📝📝📝 pic.twitter.com/y8qIzhI5cC
私の研究室で書いた論文もアップロードして「artificial life」という単語をハイライトしてみた結果は次の通りです。

すると、「Artificial life is a field of study that focuses on creating computer-based models of living things.」というなかなかちゃんとした答えが説明が返ってきます。
「Ask a follow-up question…」に書き込むことで、チャットで質問をすることもできます。

「What are applications of artificial life research?(ALIFE研究の応用は?)」と聞いてみると、「Applications of artificial life research include studying and modeling complex systems, developing new algorithms, and creating artificial intelligence.(ALIFE研究の応用は、複雑系の分析やモデル化、新しいアルゴリズムの開発、人工知能の開発などがあります)」という答えが返ってきました。なかなかです。今後どのように発展していくのか楽しみです。
ということで、今回は英語論文を読むときの助けになるツールReadableとexplainpaperを紹介しました。みなさんの論文ライフが少しでも快適になると幸いです。
最後まで読んでいただきありがとうございました。ciao!