見出し画像

LLMの内部理解に役立つTransformer Explainerの紹介

タイトル

TRANSFORMER EXPLAINER: Interactive Learning of Text-Generative Models

リンク

https://arxiv.org/pdf/2408.04619

ひとこと要約

LLMの内部計算を可視化するツールであるTransformer Explainerを開発。


メモ

  • Transformer Explainerの特徴

    • ブラウザで直接実行可能

    • リアルタイムでGPT-2モデルを操作

    • 複数の抽象化レベルを提供(構造から数学的操作まで)

    • 温度などのパラメータをインタラクティブに調整可能

  • Transformer Explainerの詳細機能(2024年8月12月時点)

    • Embeddingの可視化

    • Multi-head Self Attensionの可視化

    • QKVの計算の可視化

    • 最終層の確率計算の可視化

    • 入力文の変更

    • tempertureのスライダー

  • Transformer Explainerの技術的実装

    • フロントエンド:SvelteとD3

    • バックエンド:ONNXランタイムとHuggingFaceのTransformersライブラリ

いいなと思ったら応援しよう!