Przygotowaliśmy kolejną z tych praktycznych książek liczących ponad 200 stron na temat treningu modeli, które uwielbiamy pisać. Tym razem chodzi o wszystkie przepisy dotyczące wstępnego i końcowego treningu oraz o to, jak przeprowadzić eksplorację hiperparametrów projektu treningowego. Zamykając trylogię: 1. Budowanie zestawu danych do wstępnego treningu z „postu na blogu FineWeb” 2. Skalowanie infrastruktury klastra GPU z „Podręcznika Ultrascale” 3. A teraz wszystkie przepisy treningowe i eksploracja HP dla wstępnego i końcowego treningu z tym „Podręcznikiem Smol Training” Zespół naukowy HF w ogniu