المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1 / هل يمكن ل RL الخاص بقاعدة التعليمات البرمجية دفع حدود LLMs البرمجية؟
في @cgftlabs ، ساعدنا العميل RL على ضبط Qwen-2.5-7B على قاعدة التعليمات البرمجية الداخلية الخاصة به لإنشاء اختبار الوحدة ، باستخدام GRPO الموجه بالتغطية. النتيجة؟ إنه يتفوق على o4-mini & o3. إليك كيفية عملها (رابط إلى المدونة الكاملة في السيرة الذاتية) 🧵

7.97K
الأفضل
المُتصدِّرة
التطبيقات المفضلة