Новое исследование Anthropic: "Обратное масштабирование в вычислениях во время тестирования" Мы обнаружили случаи, когда более длительное рассуждение приводит к снижению точности. Наши результаты предполагают, что наивное масштабирование вычислений во время тестирования может непреднамеренно укрепить проблемные модели рассуждений. 🧵
143,45K