المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
يجمع FARMER بين تدفق الانحدار الذاتي القابل للعكس ، والذي يمكنه تعيين الصور من وإلى الفضاء الكامن دون فقدان المعلومات ، مع محول الانحدار الذاتي الذي يصمم توزيع كل رمز مميز كامن باستخدام مخاليط Gaussian ، مما يوفر احتمالات دقيقة في مولد أحادي المرحلة على مستوى البكسل.
يقدم ثلاثة ابتكارات رئيسية:
- يفصل تقسيم القناة الخاضع للإشراف الذاتي الميزات الكامنة إلى مجموعات إعلامية (ZI) وزائدة عن الحاجة (ZR) ، مما يؤدي إلى نمذجة الهيكل والتفاصيل بكفاءة.
- يعمل التوجيه الخالي من المصنف المستند إلى إعادة التشكيل (CFG) على تحسين جودة الصورة وتمكين أخذ العينات التي يمكن التحكم فيها.
- يعمل تقطير التركيز البؤري التلقائي بخطوة واحدة على تسريع التوليد عن طريق استبدال الانعكاس المتسلسل البطيء بخطوة عكسية واحدة سريعة.
في ImageNet-256 (عينات شرطية للفئة، 50 كيلو عينات)، يحقق طراز 1.9B Patch-8 FID 3.60 / IS 269.21 / Prec 0.81 / Rec 0.51. بعد +60 حقبة، يصبح الاستدلال أسرع بمقدار 22× للتركيز البؤري التلقائي العكسي (0.1689 ثانية → 0.0076 ثانية لكل صورة) وأسرع بحوالي 4× بشكل عام (0.2189 ثانية → 0.0567 ثانية لكل صورة).
إنه يتفوق على JetFormer 2.8B (FID 6.64) و TARFlow p8 (4.69) ، وهو قادر على المنافسة مع STARFlow p8. يظل متغير STARFlow المضبوط بدقة (FID 2.40) أقوى ولكنه يستخدم إعدادا متعدد المراحل.

الأفضل
المُتصدِّرة
التطبيقات المفضلة

