Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Uma relação paradoxal na tecnologia, relacionada com o paradoxo de Jevons, mas ligeiramente torta:
Os chips de IA estão disponíveis hoje
Mas você poderia implantar chips mais eficientes de forma mais eficiente em 3 anos
Qual é a pressa?
Uma tecnologia no meio de uma rápida queda de custos quase necessariamente bifurca o mercado entre aqueles que acreditam que ter acesso a tecnologia inferior hoje lhes dará uma posição muito melhor no futuro e aqueles que acham que é melhor operar um nó ou dois atrás.
O custo para gerar tokens está a colapsar.
E ainda assim, os provedores de modelos de IA estão a pagar caro--assim como os seus usuários--para gerar tokens hoje que parecerão lamentavelmente ineficientes amanhã.
Ou os usuários agressivos estão mal orientados, ou o custo de tempo de não gerar tokens tem que exceder até mesmo a íngreme curva de desempenho que a geração de tokens está a seguir.
Com base em hardware--deixando de lado melhorias arquitetónicas--o custo para gerar tokens está a reduzir-se aproximadamente pela metade anualmente. Isso deve significar que o retorno percebido na geração de tokens é pelo menos de 100% anualizado.
Um gigawatt de computação hoje é tão valioso quanto 2 GWs no próximo ano.
Isso leva, quase inevitavelmente, à computação espacial.
Sensível a vários inputs, parece que a computação de IA baseada no espaço se torna eficiente em termos de custo em comparação com a computação de IA terrestre em uma base por-token a cerca de $400 por kg em custos de lançamento.
Embora ainda não esteja lá, o Starship a volumes razoáveis--o que esperávamos que a SpaceX entregasse até 2030 antes que a oportunidade de computação espacial surgisse--deve ultrapassar esse limiar de custo.
Mais importante do que o custo, no entanto, é o tempo. As empresas de IA estão famintas por flops agora.
Em toda a indústria, esperamos que os datacenters terrestres instalem 90GW em 2030, tendo cumulativamente construído 250GW entre agora e então. Isso é possível, mas agressivo, dada a dificuldade em construir infraestrutura real em lugares reais habitados por pessoas reais (que podem se jogar na frente de uma retroescavadora porque leram aquele livro que exageradamente superestimou o uso de água dos datacenters em 1000 vezes.).
...

Top
Classificação
Favoritos
