Abbiamo preparato un altro di questi libri pratici di oltre 200 pagine sulla formazione dei modelli che amiamo scrivere. Questa volta riguarda tutte le ricette di preformazione e post-formazione e come fare un'esplorazione degli iperparametri di un progetto di formazione. Chiudendo la trilogia di: 1. Creare un dataset di preformazione con il « FineWeb blog post » 2. Scalare l'infrastruttura del cluster GPU con il « Ultrascale Playbook » 3. E ora tutte le ricette di formazione e l'esplorazione degli HP per la pre- e post-formazione con questo « Smol Training Playbook » Il team scientifico di HF è in fiamme