Îmi dau seama că am săpat lucrările Anthropic în ultima vreme
Anthropic
Anthropic2 aug., 00:23
Noi cercetări antropice: vectori de persona. Modelele lingvistice uneori o iau razna și alunecă în personaje ciudate și neliniștitoare. De ce? Într-o nouă lucrare, găsim "vectori de persona" – modele de activitate neuronală care controlează trăsături precum răul, adulația sau halucinația.
7,78K