Jeg er forvirret over "10 000 mer effektive" del. Dette betyr at du kan trene stabil-diffusjon-3-lignende modell med 20 $ ~ ish mengde strøm. Hva hindrer dem i å bygge en modell og demonstrere den, utover *sjekker notat* ... Mote MNIST?
Jeg er oppriktig nysgjerrig på hva som hindrer dem i å demonstrere noe sånt som imagenet-1k
som burde ta mindre enn en dollar med strøm (hvis regnestykket mitt er riktig) for 200k trinn med trening
Er det noen som vet hvor mye dette kan sammenlignes med GPUer når det gjelder flytende drift per watt osv.? Si at jeg vil utføre 4k 4k 4k 4k multiplikasjon, hvor mye watt vil den bruke osv?