Czy możemy stwierdzić, czy gpt-oss zapamiętywał swoje dane treningowe? Tzn. punkty, w których rozumuje, a nie recytuje? Szybko przyjrzeliśmy się krzywiźnie krajobrazu strat modelu 20B, aby zrozumieć zapamiętywanie i to, co dzieje się wewnętrznie podczas rozumowania.
26,89K