Não consegui superar por que zuck pagou US$ 15 bilhões para adquirir 15 funcionários da scaleAI (empresa de dados) então eu mergulhei fundo e acho que descobri: Não estamos ficando sem dados. Na verdade, é o oposto. um único carro autônomo produz 2 TB (ou seja, 800.000 livros) de dados POR HORA. o problema é que os dados são uma bagunça, não é fácil de alimentar um LLM para treinar, então eles são jogados em um cemitério de dados para outra pessoa resolver (ninguém faz). Escassez severa de bons engenheiros de dados Aquele cemitério que mencionei acima é na verdade uma mina de ouro, se você puder classificá-lo O problema é que muito poucas pessoas têm cérebro ou tempo. Supondo que é por isso que zuck pagou US$ 15 bilhões pelos funcionários da scaleAI Dados de maior qualidade são muito mais valiosos do que a "quantidade" de dados Especialmente para modelos pós-treinamento (por exemplo, cálculo do tempo de teste). também requer menos computação, o que reduz o custo para os modelos de treinamento. Então, se sua equipe de treinamento puder 1. Classificar dados de alta qualidade 2. Injete-o no pós-treinamento e 3. Reduza custos - você vai ganhar a corrida da IA (inestimável).
1,65K