starkt stöd. Våra modeller lär sig skräp och jag tror att det inte bara är en platt prestandaskatt – det lägger till ytlighet, oönskad memorering och "taggiga singulariteter" som förmodligen ökar med skalan. Jag undrar hur olika gleshetsmetoder bidrar till problemet.