![見出し画像](https://assets.st-note.com/production/uploads/images/137501733/rectangle_large_type_2_975684d262f637a055a93d60d78a7b1d.png?width=1200)
トランスフォーマーの論文を読む⑩自己
前回は、位置エンコーディングについて解説しました。今回は、自己アテンションにフォーカスしながら論文を読み進めていきます。
まず、アテンションを使う3つの理由について考察します。さらに、ネットワーク内でどのように情報が流れるかについて、アテンション、再帰、畳み込みに関する計算量を使って比較します。
また、アテンションを使うことで得られる解釈性についても触れます。
なお、今回はこの論文を読むシリーズの最終回です。
この記事が気に入ったらチップで応援してみませんか?