Ich bin verwirrt über den Teil "10.000 mal effizienter". Das bedeutet, dass man ein Modell wie stable-diffusion-3 mit einem Betrag von etwa 20 $ an Strom trainieren kann. Was hindert sie daran, ein Modell zu bauen und es zu demonstrieren, abgesehen von *notizen überprüfen* ... Fashion MNIST? Ich bin wirklich neugierig, was sie daran hindert, etwas wie imagenet-1k zu demonstrieren, was weniger als einen Dollar an Strom kosten sollte (wenn meine Berechnungen stimmen) für 200k Trainingsschritte.