【論文】Efficient World Models with Context-Aware Tokenization

2024年7月24日 18:47

VAEで画像を潜在空間に圧縮する時に圧縮した情報全てを保持せず、一つ前のフレームとの差分を保持しworld modelを構築する手法、Δ-IRISを提案
長い時系列長をもつ視覚的に複雑な環境にも拡張可能になる

いいなと思ったら応援しよう！