no podía entender por qué zuck pagó 15 mil millones de dólares para adquirir 15 empleados de scaleAI (empresa de datos) así que profundicé y creo que lo entendí: No nos estamos quedando sin datos. De hecho, es lo contrario. un solo coche autónomo produce 2TB (eso son 800,000 libros) de datos POR HORA. el problema es que los datos son un desastre, no es fácil alimentarlos a un LLM para entrenar, así que simplemente se tiran a un cementerio de datos para que alguien más lo resuelva (nadie lo hace). Escasez severa de buenos ingenieros de datos Ese cementerio que mencioné arriba es en realidad una mina de oro si puedes clasificarlo el problema es que muy pocas personas tienen la inteligencia o el tiempo. Supongo que por eso zuck pagó 15 mil millones por los empleados de scaleAI Los datos de mayor calidad son mucho más valiosos que la "cantidad" de datos Especialmente para modelos post-entrenamiento (por ejemplo, computación en tiempo de prueba). también requiere menos computación, lo que reduce el costo de entrenar modelos. así que si tu equipo de entrenamiento puede 1. Clasificar datos de alta calidad 2. Inyectarlos en el post-entrenamiento y 3. Reducir costos - vas a ganar la carrera de la IA (invaluable).
1,63K