المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
في حين أن Kimi k2 من Moonshot الذكاء الاصطناعي هو النموذج الرائد غير المنطقي للأوزان المفتوحة في مؤشر ذكاء التحليل الاصطناعي ، إلا أنه ينتج ~ 3 أضعاف الرموز المميزة أكثر من النماذج غير المنطقية الأخرى ، مما يطمس الخطوط الفاصلة بين التفكير وعدم المنطق
Kimi k2 هو أكبر نموذج رئيسي للأوزان المفتوحة حتى الآن - معلمات إجمالية 1T مع 32B نشطة (يتطلب ذلك ذاكرة ضخمة تبلغ 1 تيرابايت في FP8 الأصلي لحمل الأوزان). لدينا k2 في 57 في مؤشر ذكاء التحليل الاصطناعي ، وهي درجة رائعة تضعه فوق نماذج مثل GPT-4.1 و DeepSeek V3 ، ولكن خلف نماذج التفكير الرائدة.
حتى الآن ، كان هناك تمييز واضح بين نموذج التفكير والنماذج غير المنطقية في evals لدينا - يتم تحديده ليس فقط من خلال ما إذا كان النموذج يستخدم <reasoning> العلامات ، ولكن في المقام الأول من خلال استخدام الرمز المميز. متوسط عدد الرموز المميزة المستخدمة للإجابة على جميع الرموز في مؤشر ذكاء التحليل الاصطناعي هو ~ 10 مرات أعلى لنماذج التفكير مقارنة بالنماذج غير المنطقية.
يستخدم Kimi k2 الخاص ب @Kimi_Moonshot ~ 3 أضعاف عدد الرموز التي يستخدمها النموذج المتوسط غير المنطقي. استخدام الرمز المميز أقل بنسبة تصل إلى 30٪ فقط من Claude 4 Sonnet و Opus عند تشغيله في وضع التفكير الممتد للميزانية القصوى ، وهو ما يقرب من ثلاثة أضعاف استخدام الرمز المميز لكل من Claude 4 Sonnet و Opus مع إيقاف تشغيل المنطق.
لذلك نوصي بمقارنة Kimi k2 ب Claude 4 Sonnet و Opus في أوضاع التفكير الممتدة ذات الميزانية القصوى ، وليس بدرجات غير منطقية لطرازات Claude 4.
يتوفر Kimi k2 على واجهة برمجة تطبيقات الطرف الأول من @Kimi_Moonshot بالإضافة إلى @FireworksAI_HQ و @togethercompute و @novita_labs و @parasail_io.
انظر أدناه وعلى التحليل الاصطناعي لمزيد من التحليل 👇



60.49K
الأفضل
المُتصدِّرة
التطبيقات المفضلة