تم الاستشهاد بأحدث مدونة ل Nous حول كفاءة التخفيف عبر الطرز بعد يومين فقط من نشرها 🤗 تحقق من تلك المدونة هنا:
Jason Weston
Jason Weston‏19 أغسطس، 10:15
🤖تقديم OptimalThinkingBench 🤖 📝: - التفكير في LLMs يستخدم الكثير من الرموز المميزة والإفراط في التفكير ؛ LLMs غير المفكرين لا يفكرون في التفكير وضعف الأداء. - نقدم معيارا يسجل النماذج في السعي للعثور على أفضل مزيج. - أبلغ OptimalThinkingBench عن درجة F1 التي تمزج بين OverThinkingBench (استعلامات بسيطة في 72 مجالا) و UnderThinkingBench (11 مهمة تفكير صعبة). - نقوم بتقييم 33 نموذجا مختلفا من SOTA ونجد أن هناك حاجة إلى تحسينات! 🧵1/5
‏‎8.67‏K