je ne pouvais pas comprendre pourquoi zuck a payé 15 milliards de dollars pour acquérir 15 employés de scaleAI (entreprise de données) alors j'ai approfondi et je pense avoir compris : Nous ne manquons pas de données. En fait, c'est le contraire. une seule voiture autonome produit 2 To (soit 800 000 livres) de données PAR HEURE. le problème, c'est que ces données sont un désordre, pas faciles à intégrer dans un LLM pour l'entraînement, donc elles finissent dans un cimetière de données que quelqu'un d'autre doit résoudre (personne ne le fait). Pénurie sévère de bons ingénieurs en données Ce cimetière dont j'ai parlé est en réalité une mine d'or si vous pouvez le trier le problème, c'est que très peu de gens ont l'intelligence ou le temps. Je suppose que c'est pourquoi zuck a payé 15 milliards de dollars pour les employés de scaleAI Des données de meilleure qualité sont beaucoup plus précieuses que la "quantité" de données Surtout pour les modèles post-entraînement (par exemple, le calcul au moment du test). cela nécessite également moins de calcul, ce qui réduit le coût de l'entraînement des modèles. donc si votre équipe d'entraînement peut 1. Trier des données de haute qualité 2. Les injecter dans le post-entraînement et 3. Réduire les coûts - vous allez gagner la course à l'IA (inestimable).
1,61K