Nowe badania Anthropic: "Odwrócone skalowanie w obliczeniach w czasie testu" Znaleźliśmy przypadki, w których dłuższe rozumowanie prowadzi do niższej dokładności. Nasze odkrycia sugerują, że naiwne skalowanie obliczeń w czasie testu może nieumyślnie wzmacniać problematyczne wzorce rozumowania. 🧵
143,38K