puta merda... Hugging Face cozinhou novamente! 🔥 eles acabaram de lançar um blog gratuito (BOOK) que cobre a realidade da construção de modelos SOTA. Eu não vi nenhum laboratório / pesquisador entrar nas decisões reais por trás da pesquisa do LLM e suas nuances. isso é literalmente uma joia. Programa: → Bússola de treinamento: por que → o que → como → Todo modelo grande começa com uma pequena ablação → Projetando a arquitetura do modelo → A arte da curadoria de dados → A maratona de treinamento → Além dos modelos básicos — pós-treinamento em 2025 → Infraestrutura - o herói desconhecido Folheando o blog, isso é incrivelmente detalhado, assim como o manual de ultraescala. Vou ler isso e compartilhar mais sobre isso nos próximos dias. Leia aqui: