não conseguia entender porque o zuck pagou 15 mil milhões para adquirir 15 funcionários da scaleAI (empresa de dados) então fiz uma pesquisa profunda e acho que percebi: Não estamos a ficar sem dados. Na verdade, é o oposto. um único carro autónomo produz 2TB (isso equivale a 800.000 livros) de dados POR HORA. o problema é que os dados são uma confusão, não é fácil alimentá-los num LLM para treinar, então acabam por ser lançados num cemitério de dados para alguém resolver (ninguém o faz). Escassez severa de bons engenheiros de dados Esse cemitério que mencionei acima é na verdade uma mina de ouro se você conseguir filtrar através dele o problema é que muito poucas pessoas têm a inteligência ou o tempo. Acredito que é por isso que o zuck pagou 15 mil milhões pelos funcionários da scaleAI Dados de maior qualidade são muito mais valiosos do que a "quantidade" de dados Especialmente para modelos pós-treinamento (por exemplo, computação em tempo de teste). também requer menos computação, o que reduz o custo de treinar modelos. então, se a sua equipe de treinamento conseguir 1. Filtrar dados de alta qualidade 2. Injetá-los no pós-treinamento e 3. Reduzir custos - você vai ganhar a corrida da IA (inestimável).
1,65K