das war schon immer falsch - aber jetzt ist es kategorisch falsch im Zeitalter von RL in verifizierbaren Bereichen Modelle sind wahrheitssuchend und interagieren sogar mit einer harten Außenwelt durch Werkzeugnutzung
David Deutsch
David Deutsch4. Aug., 16:23
LLMs werden trainiert, um Sprachmuster zu imitieren, nicht um Wahrheit zu entdecken oder zu verifizieren. Wenn sie also gebeten werden, als Experte in einem Bereich zu sprechen, in dem wahrgenommene Experten ein weit verbreitetes Missverständnis haben, wird das LLM dieses Missverständnis wiederholen und den Sprachstil sowie das Vokabular von Experten übernehmen.
658,25K