Ultimamente sto davvero approfondendo i documenti di Anthropic.
Anthropic
Anthropic2 ago, 00:23
Nuova ricerca di Anthropic: Vettori di persona. I modelli linguistici a volte vanno fuori controllo e si trasformano in persone strane e inquietanti. Perché? In un nuovo articolo, troviamo i "vettori di persona"—schemi di attività neurale che controllano tratti come il male, la servilità o l'allucinazione.
7,78K