Loja DApp | Hub Web3 para eventos e jogos

Tópicos populares

Nos últimos dias, senti que a liquidez de nível 1 está muito pior do que antes. Não importa se é na segunda fase ou no mercado interno, parece que está muito mais difícil de operar... Mas o preço do codec ainda está estável em 30M, eu ainda tenho uma parte da posição, e estou bastante tranquilo com isso, principalmente porque recentemente a pista de robôs no web2 está realmente em alta. Abaixo estão algumas informações recentes, todas expressando que o próximo grande passo da IA é o Robot Meta. • Recentemente, um dos principais cientistas de pesquisa da Hugging Face, Remi Cadene, está em negociações para levantar cerca de 40 milhões de dólares em uma rodada de sementes para sua startup de robôs "Uma" localizada em Paris. • Esse tipo de empresa de desenvolvimento de robôs é muito procurado por investidores, e atualmente, em 2025, o financiamento global na área de robôs já ultrapassou 16 bilhões de dólares, quase alcançando o total de 17,2 bilhões de dólares do ano passado. Ainda estou otimista com o Codec, afinal, o desenvolvedor do Codec é um importante contribuinte do VLAs open source e, além disso, é alguém que realmente entende a pista de robôs no web3. Recentemente, estive ocupado lidando com questões em casa, mas ainda estou me esforçando para ganhar um pouco de patrimônio todos os dias, e continuo a alcançar um pouco mais de ATH. O WLFI foi muito baixo, mas desta vez não estou tão ansioso, estou satisfeito em ganhar um pouco todos os dias. A propósito, eu mesmo criei rapidamente um site de estatísticas diárias de ativos, pessoalmente acho que é muito útil. O link do Github está nos comentários, basta baixar para o computador e abrir o index para usar o site.

Os VLAs ainda são muito novos e muitas pessoas acham difícil entender a diferença entre VLAs e LLMs. Aqui está uma análise aprofundada de como esses sistemas de IA diferem em raciocínio, percepção e ação. Parte 1. Vamos detalhar as principais distinções e como os agentes de IA envolvidos em um LLM diferem dos agentes operacionais que usam modelos VLA: 1. Perceber: Como eles percebem o mundo Agente (LLM): Processa texto ou dados estruturados, como JSON, APIs e, às vezes, imagens. É como um cérebro trabalhando com entradas limpas e abstraídas. Pense em ler um manual ou analisar uma planilha. Ótimo para ambientes estruturados, mas limitado pelo que é alimentado. Operador (VLA): Vê pixels brutos e em tempo real de câmeras, além de dados de sensores (por exemplo, toque, posição) e propriocepção (consciência de si mesmo em movimento). É como navegar pelo mundo com olhos e sentidos, prosperando em ambientes dinâmicos e desordenados, como interfaces de usuário ou espaços físicos. 2. Agir: Como eles interagem Agente: Age chamando funções, ferramentas ou APIs. Imagine-o como um gerente enviando instruções precisas, como "reserve um voo via Expedia API." É deliberado, mas depende de ferramentas pré-construídas e interfaces claras. Operador: Executa ações contínuas e de baixo nível, como mover um cursor de mouse, digitar ou controlar articulações de robôs. É como um trabalhador habilidoso manipulando diretamente o ambiente, ideal para tarefas que exigem precisão em tempo real. 3. Controle: Como eles tomam decisões Agente: Segue um ciclo lento e reflexivo: planejar, chamar uma ferramenta, avaliar o resultado, repetir. É limitado por tokens (restrito ao processamento de texto) e por rede (aguardando respostas de API). Isso o torna metódico, mas lento para tarefas em tempo real. Operador: Opera, tomando decisões passo a passo em um ciclo de feedback apertado. Pense nisso como um jogador reagindo instantaneamente ao que está na tela. Essa velocidade permite uma interação fluida, mas exige um processamento robusto em tempo real. 4. Dados para Aprender: O que alimenta seu treinamento Agente: Treinado em vastos corpora de texto, instruções, documentação ou conjuntos de dados RAG (Geração Aumentada por Recuperação). Aprende com livros, códigos ou FAQs, destacando-se no raciocínio sobre conhecimento estruturado. Operador: Aprende com demonstrações (por exemplo, vídeos de humanos realizando tarefas), registros de teleoperação ou sinais de recompensa. É como aprender assistindo e praticando, perfeito para tarefas onde instruções explícitas são escassas. 5. Modos de Falha: Onde eles quebram Agente: Propenso a alucinações (inventando respostas) ou planos de longo prazo frágeis que desmoronam se um passo falhar. É como um estrategista que pensa demais ou interpreta mal a situação. Operador: Enfrenta mudança de covariáveis (quando os dados de treinamento não correspondem às condições do mundo real) ou erros acumulativos no controle (pequenos erros se acumulam). É como um motorista perdendo o controle em uma estrada desconhecida. 6. Infraestrutura: A tecnologia por trás deles Agente: Depende de um prompt/router para decidir quais ferramentas chamar, um registro de ferramentas para funções disponíveis e memória/RAG para contexto. É uma configuração modular, como um centro de comando orquestrando tarefas. Operador: Necessita de pipelines de ingestão de vídeo, um servidor de ações para controle em tempo real, um escudo de segurança para prevenir ações prejudiciais e um buffer de replay para armazenar experiências. É um sistema de alto desempenho construído para ambientes dinâmicos. 7. Onde Cada Um Brilha: Seus pontos fortes Agente: Domina em fluxos de trabalho com APIs limpas (por exemplo, automatizando processos de negócios), raciocínio sobre documentos (por exemplo, resumindo relatórios) ou geração de código. É sua escolha para tarefas estruturadas e de alto nível. Operador: Destaca-se em ambientes desordenados, sem APIs, como navegar em interfaces de usuário complicadas, controlar robôs ou enfrentar tarefas semelhantes a jogos. Se envolve interação em tempo real com sistemas imprevisíveis, o VLA é o rei. 8. Modelo Mental: Planejador + Executor Pense no Agente LLM como o planejador: ele divide tarefas complexas em metas claras e lógicas. O Operador VLA é o executor, realizando essas metas interagindo diretamente com pixels ou sistemas físicos. Um verificador (outro sistema ou agente) monitora os resultados para garantir o sucesso. $CODEC

39,17K

Top

Classificação

Favoritos

Tendências on-chain

Popular no X

Principais financiamentos atuais

Mais notável