見出し画像

TOEIC870点が教える英語論文を高速で読む方法

こんにちは。
今日は、TOEIC870点の私が英語の論文を高速で読む方法を共有していきたいと思います。
この方法は英語論文をまるで日本語で読んでいるかのように感じるほどスラスラと読むことができます。

それではまずその読み方についての結論から。

結論: DeepL apiを使え!!

「お前TOEIC870点なのに英語で読んでねーじゃん」と思ったそこのあなた。
考え方が逆です。この世の中では何を言うかより誰が言うかが大事なのです。つまり、TOEIC600点の人が語る英語飛ばし読み法よりもTOEIC870点が語るDeepL apiの方が権威があるのです。

と言うことで今日はDeepL apiの使い方、論文テキストの前処理について話していきたいと思います。

デデーン(権威)

まずは、DeepL apiを用いた英語論文の翻訳の流れから。

  1. 論文のテキストをテキストファイルにコピペする

  2. テキストを適当に前処理する

  3. DeepL apiに食べさせて出てきた文章を見る

1のコピペについて、Qiitaに生息する物好きな人たちは画像認識とかを使ってテキストを抽出しているけど、結局はアナログにコピペした時の方が早いっす(arXivはHTMLあるし)。ここで通常のDeepL(webのやつ)でコピペ翻訳するときに発生するあるある言いたい〜。

DeepLコピペ翻訳あるある
数式の記号が改行されてカオス

ありますね〜

このあるあるを解決するために2の前処理を行います。
勝手に改行されてしまう問題を解決するにはどうしたらいいと思いますか?

単純に考えると全部の改行を無くして一つの文として翻訳してしまえば良いすね。でもDeepL apiには一度に送れるtoken数(文字数)の制限があるからつまりは以下の手順に従うのが良さそうです。

  1. 全ての文章の改行を無くして一つの文にする

  2. 各文のピリオドで改行をする

このようにすれば余計な改行が無くなりますね。ここで注意点なんですけどfig. やtab. , i.e.のピリオドでは改行をしたくないます。それらを改行しないようにする方法は自分で考えるます。

ここまで来ればあとはDeepL apiに文章を食べさせて、日本語に翻訳された結果を見るだけです。DeepL apiの使い方とかは公式documentを見るかQiita, chatGPTあたりに聞いてください。

以上がDeepL apiを使った英語論文翻訳の仕方でした。あとは日本語と実際の論文を見比べながら読み解くだけです。大事そうなところは原文で読んだ方がいいです。
ここでDeepL apiの良い点として月に500k tokenまで無料と言うのがあるす。通常のDeepLあるあるとしてすぐに上限になってしまうというのがあるけど、500k tokenはほとんどなくなることは無いす。

ということで以上がTOEIC870点が教える英語論文を高速で読む方法すね。
さよならます。


いいなと思ったら応援しよう!