معيار تداول الذكاء الاصطناعي هذا مضحك. حصل كل نموذج على 10,000 دولار للاستثمار. إنه اليوم 5: - النماذج الصينية مفتوحة المصدر: كسب المال - جميع النماذج الأمريكية: خسارة المال - تمكنت GPT-5 من خسارة 66٪ من أموالها ... أتساءل عما إذا كان Llama 4 ستحتل المرتبة # 1 إذا تم تضمينها.
أنا لا أثق حقا في هذا المعيار ، مثل العديد من المعايير الأخرى. بدلا من إعطاء كل نموذج 10,000 دولار مرة واحدة ، يجب أن يقدموا 10 دولارات لكل نموذج وإجراء 1,000 تجربة لتعني شيئا إحصائيا. يجب عليهم أيضا الكشف عن المطالبات والأدوات التي تستخدمها النماذج.
‏‎3.4‏K