Я слышал, что обучение с подкреплением работает только с проверяемыми наградами? 😛 Поздравляю!!
Alexander Wei
Alexander Wei19 июл. 2025 г.
1/N Я рад поделиться тем, что наш последний экспериментальный LLM от @OpenAI достиг давнего грандиозного вызова в ИИ: золотого медального уровня на самом престижном математическом соревновании в мире — Международной математической олимпиаде (IMO).
31,65K