Искусственный интеллект на Олимпиаде по математике: новая эра решения математических задач Международная математическая олимпиада (IMO) долгое время была самой сложной математической конкуренцией для лучших студентов. Теперь она также становится эталоном для рассуждений ИИ.👇
Этот год стал знаковым: Модели ИИ от Google DeepMind и OpenAI достигли золотого уровня производительности по задачам IMO — на том же уровне, что и лучшие человеческие участники. Настоящий скачок в способности ИИ рассуждать над абстрактной математикой.
Хронология событий: > Пятница: Утечка новостей о золотой медали DeepMind > Суббота, 1:00: OpenAI объявила результаты до официального подтверждения > Понедельник: DeepMind официально подтвердила статус золотой медали с элегантными решениями, полностью проверенными чиновниками IMO. Их решения были более элегантными и тщательно проверенными.
Технологический сдвиг с 2024 по 2025 год В прошлом году: модели искусственного интеллекта, такие как AlphaGeometry, нуждались в трансляции предметной области (Lean и т. д.) + 2–3 дня вычислений. В этом году: модели Gemini и OpenAI решали задачи от начала до конца на естественном языке, в пределах 4,5-часового лимита IMO.
Различия в стиле Ответы OpenAI: > Логически обоснованные, но неаккуратные > Не хватало структуры, чрезмерно использовались термины вроде "запрещенный" > Более 400 строк для некоторых задач > Не читаемы для человека Доказательства Gemini: > Элегантные и ясные, по мнению оценщиков, они были "легкими для восприятия" > Могли бы пройти за написанные человеком
Задача 2 (Геометрия) показала зазор: OpenAI использовал перебор координатной геометрии → правильного, но неуклюжего доказательства из 442 строк В Gemini от DeepMind использовалась погоня за углом и теорема Сильвестра → лаконичного, проницательного решения, которое отражало опытного человека.
Почему Gemini преуспели > Параллельное мышление: изучение нескольких путей решения одновременно > Новые методы обучения с подкреплением, улучшающие многоступенчатое мышление > Доступ к тщательно подобранным математическим решениям и стратегическим подсказкам
Подход OpenAI? Общего назначения RL + масштабирование вычислений во время тестирования.
Что это значит Решение задач IMO впечатляет, но реальная математика идет глубже: > Абстрактное мышление > Создание концепции > Исследовательская интуиция Мы еще не достигли этого, но это реальный шаг вперед.
Чтобы по-настоящему продвинуть математические возможности ИИ, нам понадобятся: > Функции гранулярного вознаграждения > Специализированные трубопроводы RL > А может быть... Техника джокера, которую никто не ожидал
Поскольку ИИ проникает в математику, науку и исследования — необходимость в вычислительных мощностях взрывается. Вот почему доступ к доступной, масштабируемой инфраструктуре GPU имеет критическое значение. Давайте сделаем это будущее доступным для всех.
Посмотрите полный блог здесь:
Наш полный подкаст с Latent Space здесь:
1,06K