cavolo... Hugging Face ha fatto di nuovo centro! 🔥 hanno appena pubblicato un blog gratuito (LIBRO) che copre la realtà senza fronzoli della costruzione di modelli SOTA. non ho visto alcun laboratorio/ricercatore entrare nelle vere decisioni dietro la ricerca LLM e le sue sfumature. questo è letteralmente un gioiello. Programma: → Bussola di addestramento: perché → cosa → come → Ogni grande modello inizia con una piccola ablazione → Progettazione dell'architettura del modello → L'arte della curatela dei dati → La maratona di addestramento → Oltre i modelli di base — post-addestramento nel 2025 → Infrastruttura - l'eroe sconosciuto sfogliando il blog, è incredibilmente dettagliato proprio come il loro playbook ultrascale. lo leggerò e condividerò di più nei prossimi giorni. Leggi qui: