Mohli bychom zjistit, zda si gpt-oss pamatoval svá trénovací data? Tj. body, kde je to uvažování vs recitace? Rychle jsme se podívali na zakřivení ztrátového prostředí modelu 20B, abychom porozuměli zapamatování a tomu, co se děje vnitřně během uvažování
15,26K