Doi parametri interesanți în interacțiunile mele cu oamenii și LLM-urile sunt coeziunea și generalitatea. Coeziunea descrie cât de stabile sunt politicile și credințele, generalitatea descrie cât de bine pot fi integrate noile observabile, fapte și idei.
Unii oameni sunt mai coezivi și/sau mai generali decât alții. Dacă pui oamenii în privațiuni senzoriale sau în medii de cult, ei tind să iasă de pe șine cu viteze și viteze diferite, evidente prin halucinații și schimbări iraționale de politică.
Putem construi un punct de referință de coerență care să compare direct coeziunea și generalitatea oamenilor și a LLM-urilor? "Psihoza LLM" descrie o situație în care LLM este mai coeziv decât interlocutorul uman, astfel încât omul este deraiat. "Jailbreaking" este opusul.
4,86K