這一直都是錯誤的——但在可驗證領域的RL時代,這種錯誤是絕對的。 模型是追求真理的,甚至通過工具使用與一個嚴酷的外部世界互動。
David Deutsch
David Deutsch8月4日 16:23
大型語言模型(LLMs)是被訓練來模仿語言的模式,而不是去發現或驗證真相。因此,當被要求以某個領域的專家身份發言時,如果該領域的專家存在廣泛的誤解,LLM將會重複這種誤解,採用專家的語調和詞彙。
657.38K