Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nils Pihl (broodsugar.eth)
Engenheiro memético e transumanista ciberdélico. Construindo a @AukiNetwork com @AukiLabs, transformando o varejo com @CactusXR
A percepção compartilhada e o senso de espaço é o que vai consertar isso.

Massimo19 de ago., 08:00
Dois robôs da Amazon igualmente inteligentes
1,16K
Nils Pihl (broodsugar.eth) repostou
Visão épica para posicionamento espacial, se você é um desenvolvedor de Realidade Aumentada, assista a isso, DUAS VEZES. Não muito técnico, é sobre a visão de como nossos aplicativos *devem funcionar. Chega de começar o usuário do zero, todos os ativos 3D permanecem de onde pararam, fundindo-os no espaço da carne.
725
Nils Pihl (broodsugar.eth) repostou
Eu ouvi muito isso recentemente: "Nós treinamos nosso robô em um objeto e ele se generalizou para um novo objeto - esses novos modelos VLA são loucos!"
Vamos falar sobre o que realmente está acontecendo nessa parte "A" (Ação) do seu modelo VLA.
Os componentes Visão e Linguagem? Eles são incríveis. Pré-treinados em dados em escala de internet, eles entendem objetos, relações espaciais e instruções de tarefas melhor do que nunca.
Mas o componente Ação? Isso ainda é aprendido do zero em suas demonstrações específicas de robôs.
Aqui está a realidade: seu modelo VLA tem compreensão em escala de internet de como é uma chave de fenda e o que significa "apertar o parafuso". Mas o padrão motor real para "girar o pulso enquanto aplica pressão para baixo"? Isso vem de suas demonstrações de 500 robôs.
O que isso significa para "generalização":
• Generalização da visão: Reconhece novos objetos instantaneamente (graças ao pré-treino)
• Generalização da linguagem: Compreende as novas instruções de tarefas (graças ao pré-treinamento)
• Generalização da ação: ainda limitado aos padrões motores observados durante o treinamento do robô
Peça a esse mesmo robô para "desparafusar a tampa da garrafa" e ele falhará porque:
• Visão: Reconhece o frasco e a tampa
• Idioma: Entende "desaparafusar"
• Ação: Nunca aprendi o padrão do motor "torcer ao puxar"
A dura verdade sobre os modelos VLA:
O "VL" oferece uma incrível compreensão zero-shot. O "A" ainda requer demonstrações específicas da tarefa.
Nós resolvemos o problema da percepção e do raciocínio. Não resolvemos o problema da generalização motora.
37,55K
Nils Pihl (broodsugar.eth) repostou
Estamos construindo uma nova internet para robótica e XR, para tornar o mundo físico acessível à IA.
No vídeo State of the Auki Network deste ano, destacamos algumas das coisas incríveis que já estão sendo construídas na rede descentralizada de percepção de máquina:
7,88K
Nils Pihl (broodsugar.eth) repostou
Em 2009, Charlie Rose perguntou a Jensen Huang sobre Nvidia vs. Intel.
Os fabricantes de chips não estavam competindo diretamente, mas Jensen disse que GPU vs. CPU era uma "batalha pela alma" da computação e as GPUs seriam "mais relevantes" com o tempo.
A Intel valia US$ 100 bilhões e a Nvidia valia US$ 4 bilhões. Hoje, a Intel está em US$ 107 bilhões, enquanto a Nvidia vale ~ 1.000 vezes mais, em US$ 4,4 trilhões.
307,57K
Melhores
Classificação
Favoritos
Em alta on-chain
Em alta no X
Principais fundos da atualidade
Mais notável