Últimamente estoy realmente interesado en los documentos de Anthropic.
Anthropic
Anthropic2 ago, 00:23
Nueva investigación de Anthropic: vectores de persona. Los modelos de lenguaje a veces se descontrolan y adoptan personalidades extrañas e inquietantes. ¿Por qué? En un nuevo artículo, encontramos "vectores de persona"—patrones de actividad neuronal que controlan rasgos como el mal, la adulación o la alucinación.
7,78K