見出し画像

LLMの内部理解に役立つTransformer Explainerの紹介

2024年8月12日 22:02

タイトル

TRANSFORMER EXPLAINER: Interactive Learning of Text-Generative Models

リンク

https://arxiv.org/pdf/2408.04619

ひとこと要約

LLMの内部計算を可視化するツールであるTransformer Explainerを開発。

メモ

Transformer Explainerの特徴
- ブラウザで直接実行可能
- リアルタイムでGPT-2モデルを操作
- 複数の抽象化レベルを提供（構造から数学的操作まで）
- 温度などのパラメータをインタラクティブに調整可能
Transformer Explainerの詳細機能(2024年8月12月時点)
- Embeddingの可視化
- Multi-head Self Attensionの可視化
- QKVの計算の可視化
- 最終層の確率計算の可視化
- 入力文の変更
- tempertureのスライダー

Transformer Explainerの技術的実装
- フロントエンド：SvelteとD3
- バックエンド：ONNXランタイムとHuggingFaceのTransformersライブラリ

いいなと思ったら応援しよう！