Il ragionamento Chain-of-Thought degli LLM è un miraggio? ... I nostri risultati rivelano che il ragionamento CoT è un miraggio fragile che svanisce quando viene spinto oltre le distribuzioni di addestramento. Questo lavoro offre una comprensione più profonda di perché e quando il ragionamento CoT fallisce, sottolineando la continua sfida di raggiungere un ragionamento genuino e generalizzabile. ... I nostri risultati rivelano che il ragionamento CoT funziona efficacemente quando applicato a dati in distribuzione o quasi in distribuzione, ma diventa fragile e soggetto a fallimenti anche sotto spostamenti moderati della distribuzione. In alcuni casi, gli LLM generano passaggi di ragionamento fluenti ma logicamente inconsistenti. I risultati suggeriscono che ciò che appare come ragionamento strutturato può essere un miraggio, emergente da schemi memorizzati o interpolati nei dati di addestramento piuttosto che da un'inferenza logica. ... Insieme, questi risultati suggeriscono che gli LLM non sono ragionatori principiati, ma piuttosto simulatori sofisticati di testi simili al ragionamento.
2508.01191v2.pdf
43,91K