Uma relação paradoxal na tecnologia, relacionada com o paradoxo de Jevons, mas ligeiramente torta: Os chips de IA estão disponíveis hoje Mas você poderia implantar chips mais eficientes de forma mais eficiente em 3 anos Qual é a pressa? Uma tecnologia no meio de uma rápida queda de custos quase necessariamente bifurca o mercado entre aqueles que acreditam que ter acesso a tecnologia inferior hoje lhes dará uma posição muito melhor no futuro e aqueles que acham que é melhor operar um nó ou dois atrás. O custo para gerar tokens está a colapsar. E ainda assim, os provedores de modelos de IA estão a pagar caro--assim como os seus usuários--para gerar tokens hoje que parecerão lamentavelmente ineficientes amanhã. Ou os usuários agressivos estão mal orientados, ou o custo de tempo de não gerar tokens tem que exceder até mesmo a íngreme curva de desempenho que a geração de tokens está a seguir. Com base em hardware--deixando de lado melhorias arquitetónicas--o custo para gerar tokens está a reduzir-se aproximadamente pela metade anualmente. Isso deve significar que o retorno percebido na geração de tokens é pelo menos de 100% anualizado. Um gigawatt de computação hoje é tão valioso quanto 2 GWs no próximo ano. Isso leva, quase inevitavelmente, à computação espacial. Sensível a vários inputs, parece que a computação de IA baseada no espaço se torna eficiente em termos de custo em comparação com a computação de IA terrestre em uma base por-token a cerca de $400 por kg em custos de lançamento. Embora ainda não esteja lá, o Starship a volumes razoáveis--o que esperávamos que a SpaceX entregasse até 2030 antes que a oportunidade de computação espacial surgisse--deve ultrapassar esse limiar de custo. Mais importante do que o custo, no entanto, é o tempo. As empresas de IA estão famintas por flops agora. Em toda a indústria, esperamos que os datacenters terrestres instalem 90GW em 2030, tendo cumulativamente construído 250GW entre agora e então. Isso é possível, mas agressivo, dada a dificuldade em construir infraestrutura real em lugares reais habitados por pessoas reais (que podem se jogar na frente de uma retroescavadora porque leram aquele livro que exageradamente superestimou o uso de água dos datacenters em 1000 vezes.). ...