GPT-1を読む⑤事前2
前回は、OpenAIが2018年に発表したGPTの最初のバージョンの論文「Improving Language Understanding by Generative Pre-Training」の「3 Framework」(セクション3「フレームワーク」)を読み始めました。
特に、セクション3.1「教師なしの事前学習」で登場する目的関数を中心に解説しました。今回は、この続きで登場するトランスフォーマーのデコーダなどを中心に読み進めていきます。
ここでやっと下図の左側の仕組みについて触れることになります。
次に来るトークンを予測する事前学習の続きを読み進めます。
この記事が気に入ったらサポートをしてみませんか?