kunne ikke komme over hvorfor zuck betalte 15 milliarder dollar for å skaffe 15 ansatte fra scaleAI (dataselskap) så jeg dykket dypt og tror jeg fant ut av det: Vi går ikke tom for data. Faktisk er det motsatt. en enkelt selvkjørende bil produserer data verdt 2 TB (det er 800 000 bøker) PER TIME. problemet er at data er et rot, ikke lett å mate inn i en LLM for å trene, så det blir bare kastet inn på en datakirkegård for noen andre å løse (ingen gjør det). Alvorlig mangel på gode dataingeniører Den kirkegården jeg nevnte ovenfor er faktisk en gullgruve hvis du kan sortere gjennom den Problemet er at svært få mennesker har hjernen eller tiden. Antar at dette er grunnen til at zuck betalte 15 milliarder dollar for scaleAI-ansatte Data av høyere kvalitet er mye mer verdifullt enn "mengde" data Spesielt for modeller etter trening (f.eks. testtidsberegning). Det krever også mindre databehandling, noe som reduserer kostnadene for opplæringsmodeller. Så hvis treningsteamet ditt kan 1. Sortere data av høy kvalitet 2. Injiser det i ettertrening og 3. Reduser kostnadene - du kommer til å vinne ai-løpet (uvurderlig).
1,55K