Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
FARMER łączy odwracalny autoregresywny przepływ, który może mapować obrazy do i z przestrzeni latentnej bez utraty informacji, z autoregresywnym Transformerem, który modeluje rozkład każdego tokena latentnego za pomocą mieszanek Gaussa, zapewniając dokładne prawdopodobieństwa w jednolitym, poziomym generatorze pikseli.
Wprowadza trzy kluczowe innowacje:
- Samo-nadzorowane podział kanałów oddziela cechy latentne na informacyjne (Zᴵ) i redundantne (Zᴿ) grupy, efektywnie modelując strukturę i szczegóły.
- Oparte na resamplingu klasyfikatorowe bez przewodnictwa (CFG) poprawia jakość obrazu i umożliwia kontrolowane próbkowanie.
- Destylacja AF w jednym kroku przyspiesza generację, zastępując wolne sekwencyjne odwracanie jednym szybkim krokiem wstecznym.
Na ImageNet-256 (warunkowe na klasie, 50k próbek), model 1.9B patch-8 osiąga FID 3.60 / IS 269.21 / Prec 0.81 / Rec 0.51. Po +60 epokach, wnioskowanie staje się 22× szybsze dla odwracania AF (0.1689s → 0.0076s na obraz) i około 4× szybsze ogólnie (0.2189s → 0.0567s na obraz).
Przewyższa JetFormer 2.8B (FID 6.64) i TARFlow p8 (4.69), a także jest konkurencyjny z STARFlow p8. Wariant dekodera STARFlow z dostosowaniem (FID 2.40) pozostaje silniejszy, ale używa wieloetapowego ustawienia.

Najlepsze
Ranking
Ulubione

