fuertemente respaldado. Nuestros modelos están aprendiendo basura y creo que no es solo un impuesto fijo sobre el rendimiento, sino que agrega superficialidad, memorización indeseable y "singularidades puntiagudas" que probablemente aumenten con la escala. Me pregunto cómo contribuyen al problema los diferentes métodos de dispersión.