FARMER combina un flusso autoregressivo invertibile, che può mappare immagini da e verso lo spazio latente senza perdita di informazioni, con un Transformer autoregressivo che modella la distribuzione di ciascun token latente utilizzando miscele gaussiane, fornendo probabilità esatte in un generatore a livello di pixel in un'unica fase. Introduce tre innovazioni chiave: - La separazione dei canali auto-supervisionata divide le caratteristiche latenti in gruppi informativi (Zᴵ) e ridondanti (Zᴿ), modellando in modo efficiente struttura e dettaglio. - La guida senza classificatore basata sul campionamento (CFG) migliora la qualità dell'immagine e consente un campionamento controllabile. - La distillazione AF a un passo accelera la generazione sostituendo il lento ribaltamento sequenziale con un singolo passo inverso veloce. Su ImageNet-256 (condizionale per classe, 50k campioni), il modello patch-8 da 1,9B raggiunge FID 3.60 / IS 269.21 / Prec 0.81 / Rec 0.51. Dopo +60 epoche, l'inferenza diventa 22× più veloce per il ribaltamento AF (0.1689s → 0.0076s per immagine) e circa 4× più veloce in generale (0.2189s → 0.0567s per immagine). Supera JetFormer 2.8B (FID 6.64) e TARFlow p8 (4.69), ed è competitivo con STARFlow p8. La variante fine-tuned del decodificatore di STARFlow (FID 2.40) rimane più forte ma utilizza una configurazione multi-fase.