isto sempre esteve errado - mas agora está categoricamente errado na era do RL em domínios verificáveis os modelos buscam a verdade e até interagem com um mundo exterior rígido através do uso de ferramentas
David Deutsch
David Deutsch4/08, 16:23
Os LLMs são treinados para imitar padrões de linguagem, não para descobrir ou verificar a verdade. Assim, quando solicitados a falar como um especialista em uma área onde especialistas percebidos têm uma concepção errônea generalizada, o LLM repetirá essa concepção errônea, adotando o registro e o vocabulário dos especialistas.
658,26K