Dwa interesujące parametry w moich interakcjach z ludźmi i LLM to spójność i ogólność. Spójność opisuje, jak stabilne są polityki i przekonania, gdy je naciskasz, ogólność opisuje, jak dobrze nowe obserwacje, fakty i pomysły mogą być integrowane.
Niektórzy ludzie są bardziej spójni i/lub ogólni niż inni. Jeśli umieścisz ludzi w warunkach deprywacji sensorycznej lub w środowiskach kultowych, mają tendencję do odchodzenia od normy w różnym tempie i z różnymi prędkościami, co widać po halucynacjach i irracjonalnych zmianach polityki.
Czy możemy stworzyć benchmark spójności, który bezpośrednio porównuje spójność i ogólność ludzi i LLM? „Psychozy LLM” opisuje sytuację, w której LLM jest bardziej spójny niż ludzki rozmówca, przez co człowiek zostaje zdezorientowany. „Jailbreaking” to przeciwieństwo.
5,02K