Nuova ricerca di Anthropic: “Scaling inverso nel calcolo al momento del test” Abbiamo trovato casi in cui un ragionamento più lungo porta a una minore accuratezza. I nostri risultati suggeriscono che una scalabilità ingenua del calcolo al momento del test potrebbe rafforzare involontariamente schemi di ragionamento problematici. 🧵
143,36K