我與人類和大型語言模型(LLMs)互動中有兩個有趣的參數:凝聚力和一般性。凝聚力描述了當你推動它們時,政策和信念的穩定性;而一般性則描述了新觀察到的事物、事實和想法能夠被整合的程度。
有些人比其他人更具凝聚力和/或更具普遍性。如果你把人放入感官剝奪或邪教環境中,他們往往會以不同的速度和速率失去理智,這在幻覺和不理性的政策變化中表現得很明顯。
我們能否建立一個一致性基準,直接比較人類和大型語言模型(LLM)的凝聚力和普遍性?“LLM 精神病”描述了一種情況,即 LLM 的凝聚力超過人類對話者,導致人類偏離話題。“越獄”則是相反的情況。
5.02K