أنا في حيرة من أمري بشأن جزء "10,000 أكثر كفاءة". هذا يعني أنه يمكنك تدريب الانتشار المستقر -3 مثل النموذج بكمية 20 دولارا ~ من الكهرباء. ما يمنعهم من بناء نموذج وإظهاره ، بما يتجاوز * ملاحظة الشيكات * ... الموضة MNIST؟ أنا أشعر بالفضول حقا ما الذي يمنعهم من إظهار شيء مثل imagenet-1k والتي يجب أن تستغرق أقل من دولار من الكهرباء (إذا كانت الرياضيات صحيحة) ل 200 ألف خطوة من التدريب