Estou confuso sobre a parte de "10.000 vezes mais eficiente". Isso significa que você pode treinar um modelo semelhante ao stable-diffusion-3 com cerca de 20$ de eletricidade. O que os impede de construir um modelo e demonstrá-lo, além de *verificando as anotações* ... Fashion MNIST? Estou genuinamente curioso sobre o que os impede de demonstrar algo como imagenet-1k que deveria custar menos de um dólar de eletricidade (se meus cálculos estiverem corretos) para 200k passos de treinamento.