Neue Anthropic-Forschung: „Inverse Skalierung bei Testzeit-Berechnungen“ Wir haben Fälle gefunden, in denen längeres Denken zu geringerer Genauigkeit führt. Unsere Ergebnisse deuten darauf hin, dass naive Skalierung der Testzeit-Berechnungen unbeabsichtigt problematische Denkweisen verstärken kann. 🧵
143,37K