Könnten wir feststellen, ob gpt-oss seine Trainingsdaten auswendig gelernt hat? D.h. Punkte, an denen es schlussfolgert vs. rezitiert? Wir haben einen kurzen Blick auf die Krümmung der Verlustlandschaft des 20B-Modells geworfen, um das Auswendiglernen zu verstehen und was intern während des Schließens passiert.
26,89K