Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Искусственный интеллект на Олимпиаде по математике: новая эра решения математических задач
Международная математическая олимпиада (IMO) долгое время была самой сложной математической конкуренцией для лучших студентов.
Теперь она также становится эталоном для рассуждений ИИ.👇
Этот год стал знаковым:
Модели ИИ от Google DeepMind и OpenAI достигли золотого уровня производительности по задачам IMO — на том же уровне, что и лучшие человеческие участники.
Настоящий скачок в способности ИИ рассуждать над абстрактной математикой.
Хронология событий:
> Пятница: Утечка новостей о золотой медали DeepMind
> Суббота, 1:00: OpenAI объявила результаты до официального подтверждения
> Понедельник: DeepMind официально подтвердила статус золотой медали с элегантными решениями, полностью проверенными чиновниками IMO. Их решения были более элегантными и тщательно проверенными.
Технологический сдвиг с 2024 по 2025 год
В прошлом году: модели искусственного интеллекта, такие как AlphaGeometry, нуждались в трансляции предметной области (Lean и т. д.) + 2–3 дня вычислений.
В этом году: модели Gemini и OpenAI решали задачи от начала до конца на естественном языке, в пределах 4,5-часового лимита IMO.
Различия в стиле
Ответы OpenAI:
> Логически обоснованные, но неаккуратные
> Не хватало структуры, чрезмерно использовались термины вроде "запрещенный"
> Более 400 строк для некоторых задач
> Не читаемы для человека
Доказательства Gemini:
> Элегантные и ясные, по мнению оценщиков, они были "легкими для восприятия"
> Могли бы пройти за написанные человеком
Задача 2 (Геометрия) показала зазор:
OpenAI использовал перебор координатной геометрии → правильного, но неуклюжего доказательства из 442 строк
В Gemini от DeepMind использовалась погоня за углом и теорема Сильвестра → лаконичного, проницательного решения, которое отражало опытного человека.
Почему Gemini преуспели
> Параллельное мышление: изучение нескольких путей решения одновременно
> Новые методы обучения с подкреплением, улучшающие многоступенчатое мышление
> Доступ к тщательно подобранным математическим решениям и стратегическим подсказкам
Подход OpenAI?
Общего назначения RL + масштабирование вычислений во время тестирования.
Что это значит
Решение задач IMO впечатляет, но реальная математика идет глубже:
> Абстрактное мышление
> Создание концепции
> Исследовательская интуиция
Мы еще не достигли этого, но это реальный шаг вперед.
Чтобы по-настоящему продвинуть математические возможности ИИ, нам понадобятся:
> Функции гранулярного вознаграждения
> Специализированные трубопроводы RL
> А может быть... Техника джокера, которую никто не ожидал
Поскольку ИИ проникает в математику, науку и исследования — необходимость в вычислительных мощностях взрывается.
Вот почему доступ к доступной, масштабируемой инфраструктуре GPU имеет критическое значение.
Давайте сделаем это будущее доступным для всех.
Посмотрите полный блог здесь:
Наш полный подкаст с Latent Space здесь:
1,06K
Топ
Рейтинг
Избранное