見出し画像

GPT-1を読む⑤事前２

2024年5月31日 16:41

前回は、OpenAIが2018年に発表したGPTの最初のバージョンの論文「Improving Language Understanding by Generative Pre-Training」の「３ Framework」（セクション３「フレームワーク」）を読み始めました。

特に、セクション３.１「教師なしの事前学習」で登場する目的関数を中心に解説しました。今回は、この続きで登場するトランスフォーマーのデコーダなどを中心に読み進めていきます。

ここでやっと下図の左側の仕組みについて触れることになります。

論文図１

次に来るトークンを予測する事前学習の続きを読み進めます。

ここから先は

9,772字 / 12画像

キカベン・読み放題

¥1,000 / 月

初月無料

アルゴリズム、機械学習、深層学習、強化学習、量子技術をわかりやすく

すべての記事とマガジンが読み放題
メンバー限定の会員証が発行されます
活動期間に応じたバッジを表示
メンバー限定掲示板を閲覧できます
メンバー特典記事を閲覧できます
メンバー特典マガジンを閲覧できます

このメンバーシップの詳細

この記事が気に入ったらサポートをしてみませんか？