أداء على مستوى الميدالية الذهبية في أولمبياد الرياضيات الدولي لعام 2025 من أحدث ماجستير في المنطق التجريبي. يتم تشغيل النموذج بلغة طبيعية (أي إخراج براهين لغة طبيعية) وفقا لنفس قواعد البشر (على سبيل المثال 4.5 ساعات لكل جلسة ، بدون أدوات). معلم مذهل!
Alexander Wei
Alexander Wei‏19 يوليو 2025
1 / N أنا متحمس لمشاركة أن أحدث @OpenAI المنطق التجريبي لدينا قد حقق تحديا كبيرا طويل الأمد في الذكاء الاصطناعي: أداء على مستوى الميدالية الذهبية في مسابقة الرياضيات الأكثر شهرة في العالم - أولمبياد الرياضيات الدولي (IMO).
الأمر الأكثر روعة هو أن هذا النظام يستخدم نهجا عاما للغاية ، باستخدام التعلم المعزز وتوسيع نطاق حساب وقت الاختبار:
Alexander Wei
Alexander Wei‏19 يوليو 2025
5/N Besides the result itself, I am excited about our approach: We reach this capability level not via narrow, task-specific methodology, but by breaking new ground in general-purpose reinforcement learning and test-time compute scaling.
‏‎122.12‏K