بالأمس ، كنت في جميع أنحاء منزلي ، كان حدث nvidia الضخم هذا يحدث ، لذلك كنت مثل "رائع هذا مثل وضع cuda ولكن من أجل المعايير"
ولكن سرعان ما ظهر جنسن وجايدراجون حدثا جميلا من شركة 5T $ ngl
أنا في حيرة من أمري بشأن جزء "10,000 أكثر كفاءة". هذا يعني أنه يمكنك تدريب الانتشار المستقر -3 مثل النموذج بكمية 20 دولارا ~ من الكهرباء. ما يمنعهم من بناء نموذج وإظهاره ، بما يتجاوز * ملاحظة الشيكات * ... الموضة MNIST؟
أنا أشعر بالفضول حقا ما الذي يمنعهم من إظهار شيء مثل imagenet-1k
والتي يجب أن تستغرق أقل من دولار من الكهرباء (إذا كانت الرياضيات صحيحة) ل 200 ألف خطوة من التدريب
هل يعرف أي شخص مدى مقارنة هذا بوحدات معالجة الرسومات ، وشروط التشغيل العائم لكل واط ، وما إلى ذلك؟ لنفترض أنني أريد إجراء مضاعفة 4k 4k 4k ، ما مقدار الواط الذي سينفقه وما إلى ذلك؟