1/Förträning träffar en datavägg; Enbart skalning av rå webbdata leder till minskande avkastning. Idag delar @datologyai med oss av BeyondWeb, vår syntetiska datametod och alla lärdomar från att skala den till biljoner tokens🧑🏼 🍳 - 3B LLM slår 8B-modeller🚀 - Pareto frontier för prestanda
154,53K