Мене бентежить частина "10 000 ефективніше". Це означає, що ви можете тренувати модель Stable-Diffusion-3 з кількістю електроенергії 20 ~ грн. Що заважає їм побудувати модель і продемонструвати її, крім *перевіряє замітку* ... Модний MNIST? Мені щиро цікаво, що заважає їм продемонструвати щось на кшталт imagenet-1k на що має піти менше долара електроенергії (якщо моя математика правильна) на 200 тисяч кроків навчання