Исследователь OpenAI Ноам Браун о галлюцинациях с новой моделью рассуждений IMO: > Математики раньше тщательно проверяли решения моделей, потому что ранние системы тихо меняли неравенство или вставляли неверный шаг, создавая галлюцинированные ответы. > Браун говорит, что обновленная модель рассуждений IMO теперь склонна говорить "Я не уверен", когда у нее нет действительного доказательства, что резко сокращает количество этих скрытых ошибок. Вкратце, модель демонстрирует явный сдвиг от галлюцинаций к надежному, самосознательному рассуждению.
220,55K