見出し画像

【論文】Efficient World Models with Context-Aware Tokenization

  • ICML2024採択論文

VAEで画像を潜在空間に圧縮する時に圧縮した情報全てを保持せず、一つ前のフレームとの差分を保持しworld modelを構築する手法、Δ-IRISを提案
長い時系列長をもつ視覚的に複雑な環境にも拡張可能になる




いいなと思ったら応援しよう!