編碼圖像tokenizer-從VQGAN到MAGVIT 來源Agent的潛意識(shí)我們?cè)谔接憄atches的方方面面。不過patches有一個(gè)核心bug就是他的分片是簡單切割的,比如一張圖片切成9份,那么有可能,一個(gè)具象的語義信息,例如一個(gè)人臉,可能被切割在了 藍(lán)海情報(bào)網(wǎng) 2024-04-28 540 # 圖像# 離散# 分詞# 隨筆#