Відчувайте, що цьому не приділили достатньо уваги! Велика справа, якщо це правда і розгортання. Ви чули, що хлопці з GPU/ASIC вже говорять про масштабування ACROSS центрів обробки даних. Це не просто дата-центри, розташовані на державних кордонах далеко один від одного. Говорячи про 1 000 км+. Якщо це правда, це пропонує потенційний обхідний шлях щодо деяких обмежень фізичної інфраструктури/потужності, оскільки вам не потрібно мати всі МВт/ГВт в одному місці, і ви можете набагато ефективніше підключатися до мережі в кількох місцях (і тих, що мають менші обмеження). Хто його купує, а хто ні? Давайте послухаємо Розподілене навчання вже тут? «@EpochAIResearch дослідження показують, що проведення тренувальних заїздів потужністю 10 ГВт на двох десятках майданчиків, пов'язаних мережею, що охоплює тисячі км, є можливим. Використовуючи недозавантажену генерацію як показник доступності електроенергії, ми виявляємо мережу протяжністю 4 800 км з 23 об'єктів у США, які теоретично можуть підтримувати розподілений кластер штучного інтелекту потужністю 10 ГВт... Проведення великих децентралізованих тренувальних забігів можливе без значного збільшення часу на тренування або бюджету».