見出し画像

GPT-1を読む⑤事前2

前回は、OpenAIが2018年に発表したGPTの最初のバージョンの論文「Improving Language Understanding by Generative Pre-Training」の「3 Framework」(セクション3「フレームワーク」)を読み始めました。

特に、セクション3.1「教師なしの事前学習」で登場する目的関数を中心に解説しました。今回は、この続きで登場するトランスフォーマーのデコーダなどを中心に読み進めていきます。

ここでやっと下図の左側の仕組みについて触れることになります。

論文図1

次に来るトークンを予測する事前学習の続きを読み進めます。


ここから先は

9,772字 / 12画像

キカベン・読み放題

¥1,000 / 月
初月無料
このメンバーシップの詳細

この記事が気に入ったらサポートをしてみませんか?