FARMER kombiniert einen umkehrbaren autoregressiven Fluss, der Bilder ohne Informationsverlust in den latenten Raum und zurück abbilden kann, mit einem autoregressiven Transformer, der die Verteilung jedes latenten Tokens mithilfe von Gaußschen Mischungen modelliert und exakte Wahrscheinlichkeiten in einem einstufigen, pixelbasierten Generator bereitstellt. Es führt drei wichtige Innovationen ein: - Der selbstüberwachte Kanal-Split trennt latente Merkmale in informative (Zᴵ) und redundante (Zᴿ) Gruppen und modelliert effizient Struktur und Detail. - Die auf Resampling basierende klassifikationsfreie Anleitung (CFG) verbessert die Bildqualität und ermöglicht kontrollierbares Sampling. - Die ein Schritt umfassende AF-Destillation beschleunigt die Generierung, indem sie die langsame sequenzielle Umkehrung durch einen einzigen schnellen Umkehrschritt ersetzt. Auf ImageNet-256 (klassenbedingt, 50k Proben) erreicht das 1,9B Patch-8-Modell FID 3,60 / IS 269,21 / Prec 0,81 / Rec 0,51. Nach +60 Epochen wird die Inferenz 22× schneller für AF-Rückwärts (0,1689s → 0,0076s pro Bild) und etwa 4× schneller insgesamt (0,2189s → 0,0567s pro Bild). Es übertrifft JetFormer 2,8B (FID 6,64) und TARFlow p8 (4,69) und ist wettbewerbsfähig mit STARFlow p8. Die dekodierte, feinabgestimmte Variante von STARFlow (FID 2,40) bleibt stärker, verwendet jedoch ein mehrstufiges Setup.