Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Gavin Baker
Sim. E muito alavancado tanto para GPUs quanto para TPUs.

Vikram Sekar23 de nov., 18:17
Óptica é a próxima Memória.
Você só não sabe ainda.
241,67K
Ontem, @RealJimChanos postulou que o capex relativamente baixo da Tesla significava que eles não eram um concorrente sério em IA e robótica do mundo real.
Esta é *exatamente* a maneira errada de olhar para isso e as implicações desse fato são realmente positivas para a Tesla IMO.
A inferência da Tesla acontece por definição no carro, então seus clientes estão efetivamente pagando pelo "capex" de cálculo de inferência, que agora é provavelmente a maior parte dos gastos com capex do hiperescalador.
O capex da Tesla poderia ser uma ordem de magnitude maior se eles tivessem que gerar sinteticamente dados de direção relevantes em um datacenter. A integração vertical subsidiada pelo cliente é linda.
É também por isso que, em algum momento, os clientes da Tesla poderão colocar seus carros em um pool de computação de borda distribuída e ganhar dinheiro quando o carro não estiver dirigindo - da mesma forma que a Akamai e a Cloudflare estão colocando GPUs únicas em seus nós de borda.
A frota da Tesla como a maior e mais distribuída CDN do mundo para IA (e apenas a IA, obviamente, não pode armazenar conteúdo em cache nos carros) é uma possibilidade real. A BYD terá uma oportunidade semelhante e uma vantagem de custo de inferência semelhante.
Além dessa vantagem significativa de custo de inferência, a Tesla tem o segundo maior cluster Hopper coerente - atrás apenas do xAI - do mundo para pré-treinamento. Você só precisa de um cluster coerente *se* for grande o suficiente. O tamanho coerente do cluster impulsiona a eficiência de capital para pré-treinamento.
Ninguém foi capaz de igualar os clusters xAI e Tesla do ponto de vista da coerência, velocidade e custo, sendo a coerência a mais importante. É por isso que Jensen descreveu o design e a execução do datacenter como "sobre-humanos". Deve-se notar que a Tesla também tem um cluster AI4 para pós-treinamento ou meio do treinamento ou como quer que o chamemos atualmente.
A Tesla também tem uma vantagem significativa de dados para treinar modelos FSD ideais da Chinchilla, pois o vídeo do mundo real é dimensionado infinitamente e essa vantagem de dados reduz ainda mais o custo de treinamento capitalizado - menos geração de dados sintéticos e fornecimento / rotulagem de dados 3P em comparação com LLMs de treinamento em laboratórios.
Essa eficiência de capital relativa como resultado de todas essas vantagens - o maior cluster coerente, clientes pagando por inferência, tamanho do conjunto de dados e custo contínuo de geração de dados - provavelmente será importante em comparação com os concorrentes de robótica e FSD que são menos eficientes em termos de capital.
O custo por token é tudo para a IA. O Google é o produtor de baixo custo de tokens LLM (com xAI como # 2), mas a Tesla é a produtora de tokens de menor custo que importam para FSD e Robótica.
A IA é a primeira vez em minha carreira que ser o produtor de baixo custo é importante, pois a quantidade de tokens impulsiona efetivamente a qualidade em um mundo racional. Acho que essa dinâmica é muito subestimada pelo mercado.
A Tesla pode muito bem ser superada por um concorrente do FSD - improvável do meu ponto de vista, mas tudo é possível - mas isso não acontecerá por causa de seus gastos relativos com capex.
Se a inferência de LLM acontecesse na borda em telefones e PCs, como no FSD, o capex do hiperescalador seria *muito* menor. Esse é o risco real para os gastos do datacenter, nem todo o valor/macro leva. A propósito - a memória é a maior vencedora neste cenário, que está a anos de distância se as leis de escala continuarem a se manter.
Jim é um cara inteligente, mas eu humildemente acho que suas tomadas de IA estão mal informadas.
Também é tão estranho para mim que alguém esteja focado na IA como uma bolha, dadas as bolhas quânticas e nucleares extremamente óbvias, onde há muitas ações que podem cair 99% e ainda ser supervalorizadas.

178,27K
Melhores
Classificação
Favoritos


