Не даже бронза: Оценка LLM на Международной математической олимпиаде 2025 года 🥉 Хорошая статья в блоге от команды MathArena: Оценка LLM на неконтаминированных математических соревнованиях () предоставляет независимый анализ производительности LLM на IMO.
Похоже, что продвинутая версия Gemini с Deep Think только что решила 5 из 6 задач IMO, заработав 35 баллов и официально достигнув уровня золотой медали. Поздравляем с достижением @lmthang❗️ Не могу дождаться, чтобы поиграть с этой моделью
42,72K