Este é o melhor recurso público sobre escalonamento de hardware para IA, e é gratuito. "Como Escalar o Seu Modelo" é a bíblia do Google DeepMind que cobre a matemática, sistemas e leis de escalonamento para cargas de trabalho de treino e inferência de LLM. Acessível, mas completo. Leitura absolutamente obrigatória.
Livro completo:
67,49K