Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nils Pihl (broodsugar.eth)
Ingeniero memético y transhumanista ciberdélico. Construyendo el @AukiNetwork con @AukiLabs, transformando el comercio minorista con @CactusXR
La percepción compartida y el sentido del espacio es lo que solucionará esto.

Massimohace 5 horas
Dos robots de Amazon igualmente inteligentes
299
Nils Pihl (broodsugar.eth) reposteó
Visión épica para el posicionamiento espacial, si eres un desarrollador de Realidad Aumentada, mira esto, TWICE. No demasiado tecnológico, se trata de la visión de cómo deberían funcionar nuestras aplicaciones. No más comenzar al usuario desde cero, todos los activos 3D permanecen donde lo dejaron por última vez, fusionándolos en el espacio de la carne.
310
Nils Pihl (broodsugar.eth) reposteó
He escuchado esto mucho recientemente: "Entrenamos nuestro robot en un objeto y se generalizó a un objeto novedoso: ¡estos nuevos modelos de VLA son una locura!"
Hablemos de lo que realmente está sucediendo en esa parte "A" (Acción) de su modelo VLA.
¿Los componentes de Visión y Lenguaje? Son increíbles. Preentrenados con datos a escala de Internet, entienden los objetos, las relaciones espaciales y las instrucciones de tareas mejor que nunca.
¿Pero el componente de acción? Eso todavía se aprende desde cero en sus demostraciones específicas de robots.
Esta es la realidad: su modelo VLA tiene una comprensión a escala de Internet de cómo se ve un destornillador y qué significa "apretar el tornillo". Pero, ¿el patrón motor real para "girar la muñeca mientras se aplica presión hacia abajo"? Eso proviene de sus demostraciones de 500 robots.
Lo que esto significa para la "generalización":
• Generalización de la visión: Reconoce objetos novedosos al instante (gracias al entrenamiento previo)
• Generalización del lenguaje: Comprende las nuevas instrucciones de la tarea (gracias al entrenamiento previo)
• Generalización de acciones: todavía limitado a los patrones motores observados durante el entrenamiento de robots
Pídale a ese mismo robot que "desenrosque la tapa de la botella" y falla porque:
• Visión: Reconoce la botella y la tapa
• Idioma: Entiende "desenroscar"
• Acción: Nunca aprendí el patrón de motor de "girar mientras tira"
La dura verdad sobre los modelos de VLA:
El "VL" le brinda una increíble comprensión de disparo cero. La "A" todavía requiere demostraciones específicas de tareas.
Hemos resuelto el problema de la percepción y el razonamiento. No hemos resuelto el problema de la generalización motora.
25.96K
Nils Pihl (broodsugar.eth) reposteó
Estamos construyendo un nuevo Internet para la robótica y la XR, para hacer que el mundo físico sea accesible para la IA.
En el video State of the Auki Network de este año, destacamos algunas de las cosas sorprendentes que ya se están construyendo en la red de percepción de máquinas descentralizadas:
5.15K
Nils Pihl (broodsugar.eth) reposteó
En 2009, Charlie Rose le preguntó a Jensen Huang sobre Nvidia vs. Intel.
Los fabricantes de chips no competían directamente, pero Jensen dijo que GPU vs. CPU era una "batalla por el alma" de la computación y que las GPU serían "más relevantes" con el tiempo.
Intel valía $ 100 mil millones y Nvidia tenía $ 4 mil millones. Hoy, Intel está en $ 107 mil millones, mientras que Nvidia vale ~ 1,000 veces más a $ 4.4 billones.
292.79K
Populares
Ranking
Favoritas
Onchain en tendencia
Tendencia en X
Principales fondos recientes
Más destacadas