Мы подготовили еще одну из этих практических книг на более чем 200 страниц о тренировке моделей, которые нам нравится писать. На этот раз речь идет о всех рецептах предобучения и постобучения, а также о том, как провести исследование гиперпараметров в проекте обучения. Закрывая трилогию: 1. Создание набора данных для предобучения с помощью « поста в блоге FineWeb » 2. Масштабирование инфраструктуры GPU-кластера с помощью « Ultrascale Playbook » 3. А теперь все рецепты обучения и исследование гиперпараметров для предобучения и постобучения с помощью этой « Smol Training Playbook » Научная команда HF в огне