المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
يعد الحد من الهلوسة أمرا رائعا ، لكن بعض هذه المعايير تبدو وكأنها تحسينات صغيرة نسبيا على أساس التفاح إلى التفاح.
في Aider Polyglot ، دون تفكير ، 5 أعلى بمقدار 0.9 نقطة من 4o.
في MMMU ، 2.2 نقطة أعلى من 4 درجات.

8 أغسطس 2025
انخفضت معايير GPT-5 للتو
- أفضل بكثير في الترميز
– التفكير البصري أعلى من الدكتوراه البشرية
– انخفاض كبير في الهلوسة
سنرى كيف تلعب هذه المعايير ، لكنها تبدو مجنونة



لا تزال متحمسا للاستخدام!
3.09K
الأفضل
المُتصدِّرة
التطبيقات المفضلة

