Am gătit încă una dintre aceste cărți practice de 200+ pagini despre antrenamentul modelelor pe care ne place să le scriem. De data aceasta este vorba despre toate rețetele de pre-antrenament și post-antrenament și despre cum să faceți o explorare a hiperparametrilor unui proiect de antrenament. Închiderea trilogiei de: 1. Construirea unui set de date de pre-antrenament cu "postarea de blog FineWeb" 2. Scalarea clusterului de infrastructură GPU cu "Ultrascale Playbook" 3. Și acum toate rețetele de antrenament și explorarea HP pentru pre și post antrenament cu acest « Smol Training Playbook » Echipa științifică HF în flăcări