Ничего себе, 14.4% в HLE, 91.6% в AIME 25 и 59.2% в SWE. Проверено для модели на 30b (!!) — это огромно. Модели станут настолько эффективными, что локальные модели действительно станут прибыльными!