Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
FARMER combina un flusso autoregressivo invertibile, che può mappare immagini da e verso lo spazio latente senza perdita di informazioni, con un Transformer autoregressivo che modella la distribuzione di ciascun token latente utilizzando miscele gaussiane, fornendo probabilità esatte in un generatore a livello di pixel in un'unica fase.
Introduce tre innovazioni chiave:
- La separazione dei canali auto-supervisionata divide le caratteristiche latenti in gruppi informativi (Zᴵ) e ridondanti (Zᴿ), modellando in modo efficiente struttura e dettaglio.
- La guida senza classificatore basata sul campionamento (CFG) migliora la qualità dell'immagine e consente un campionamento controllabile.
- La distillazione AF a un passo accelera la generazione sostituendo il lento ribaltamento sequenziale con un singolo passo inverso veloce.
Su ImageNet-256 (condizionale per classe, 50k campioni), il modello patch-8 da 1,9B raggiunge FID 3.60 / IS 269.21 / Prec 0.81 / Rec 0.51. Dopo +60 epoche, l'inferenza diventa 22× più veloce per il ribaltamento AF (0.1689s → 0.0076s per immagine) e circa 4× più veloce in generale (0.2189s → 0.0567s per immagine).
Supera JetFormer 2.8B (FID 6.64) e TARFlow p8 (4.69), ed è competitivo con STARFlow p8. La variante fine-tuned del decodificatore di STARFlow (FID 2.40) rimane più forte ma utilizza una configurazione multi-fase.

Principali
Ranking
Preferiti

