المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
أفضل 3 ممارسات لكتابة تقييمات الذكاء الاصطناعي:
1. سرعة التوازن والصرامة
ابدأ بعشرات حالات الاختبار وكرر من هناك. لا تبني 100s عندما لا تزال تقوم بإجراء تغييرات سريعة كبيرة. حدد أكبر أوضاع الفشل وإصلاحها ، ثم قم بتوسيع التغطية.
2. الهوس بمعايير eval والملصقات اليدوية
معايير التقييم الخاصة بك ومجموعة البيانات الذهبية هي أساس كل شيء آخر. لا يمكن الالتفاف على القيام بهذا العمل اليدوي في جداول البيانات - الهوس بجعل ملصقاتك البشرية جيدة.
3. لا تقم بتوسيع نطاق قاضي LLM قبل الأوان
تهدف إلى محاذاة ~ 80٪ بين قاضي LLM الخاص بك والملصقات البشرية قبل التحجيم. تدقيق النتائج بانتظام - لا تفترض أنها صحيحة دائما.
غدا ، أشارك دليلا للمبتدئين حول تقييمات الذكاء الاصطناعي الذي يتناول مثالا خطوة بخطوة يمكن لأي شخص متابعته.
📌 قم بالتسجيل للحصول عليه في صندوق الوارد الخاص بك:
(ملاحظة. هذه هي الطريقة التي أتخيل بها شكل قاضي LLM)

4.52K
الأفضل
المُتصدِّرة
التطبيقات المفضلة