Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
FARMER поєднує в собі обернений авторегресійний потік, який може відображати зображення в латентний простір і з нього без втрати інформації, з авторегресійним трансформатором, який моделює розподіл кожного латентного токена за допомогою гаусових сумішей, надаючи точні правдоподібності в одноступеневому генераторі на рівні пікселів.
Він впроваджує три ключові нововведення:
- Поділ каналів із самонаглядом розділяє латентні ознаки на інформативні (ZI) та надлишкові (ZR) групи, ефективно моделюючи структуру та деталі.
- Навігація без класифікатора (CFG) на основі дискретизації покращує якість зображення та забезпечує контрольовану дискретизацію.
- Одноступенева дистиляція AF прискорює генерацію, замінюючи повільний послідовний розворот одним швидким зворотним кроком.
На ImageNet-256 (умовний клас, 50k зразків) модель 1.9B patch-8 досягає FID 3.60 / IS 269.21 / Prec 0.81 / Rec 0.51. Після +60 епох висновок стає на 22× швидшим для реверсивного автофокусування (0,1689 с → 0,0076 с на зображення) і приблизно на 4× швидшим загалом (0,2189 с → 0,0567 с на зображення).
Він перевершує JetFormer 2.8B (FID 6.64) і TARFlow p8 (4.69), а також конкурує зі STARFlow p8. Варіант з тонким налаштуванням декодера STARFlow (FID 2.40) залишається сильнішим, але використовує багатоступеневу установку.

Найкращі
Рейтинг
Вибране

