Nos últimos dias, senti que a liquidez do primeiro nível está muito pior do que antes Quer se trate de 2 estágios ou do jogo interno, parece muito mais difícil de jogar... No entanto, o desempenho do preço da moeda codec ainda é muito estável em 30M, e ainda tenho algumas posições na mão, o que também é muito reconfortante, principalmente porque a trilha do robô tem estado muito quente na web2 recentemente, e a seguir também estão algumas informações recentes, todas expressando que a IA é a próxima é o Robot Meta. • Recentemente, Remi Cadene, um cientista de pesquisa central da Hugging Face, está em negociações para levantar cerca de US $ 40 milhões em financiamento inicial para sua startup de robótica "Uma", com sede em Paris. • Essas empresas de pesquisa e desenvolvimento de robótica são preferidas pelos investidores, e a arrecadação global de fundos para robótica ultrapassou US$ 160 bilhões em 2025, aproximando-se da escala de US$ 172 bilhões em todo o ano passado. Ainda estou otimista em relação ao Codec, afinal, o dev do Codec é um contribuinte muito importante para o código aberto do VLAs, e atualmente é web3, então eu definitivamente conheço muito bem a trilha do robô. Recentemente, tenho estado ocupado lidando com assuntos familiares, mas ainda tento ganhar um pouco de ativos todos os dias, e continuo a ATH pouco a pouco, WLFI é muito pouco, mas desta vez não estou muito ansioso e posso ganhar um pouco de satisfação todos os dias com uma mentalidade estável. BTW, eu rapidamente Vibe um site para estatísticas diárias de ativos, eu pessoalmente acho muito útil, coloque o link do Github no comentário, baixe diretamente para o computador para abrir o site do índice e usá-lo.
CodecFlow
CodecFlow22 de ago., 18:03
Os VLAs ainda são muito novos e muitas pessoas acham difícil entender a diferença entre VLAs e LLMs. Aqui está um mergulho profundo em como esses sistemas de IA diferem em raciocínio, detecção e ação. Parte 1. Vamos detalhar as principais distinções e como os agentes de IA envolvidos em um LLM diferem dos agentes operadores que usam modelos VLA: 1. Sentido: como eles percebem o mundo Agente (LLM): processa texto ou dados estruturados, por exemplo, JSON, APIs e, às vezes, imagens. É como um cérebro trabalhando com entradas limpas e abstratas. Pense em ler um manual ou analisar uma planilha. Ótimo para ambientes estruturados, mas limitado pelo que é alimentado a ele. Operador (VLA): Vê pixels brutos e em tempo real das câmeras, além de dados do sensor (por exemplo, toque, posição) e propriocepção (autoconsciência do movimento). É como navegar pelo mundo com olhos e sentidos, prosperando em ambientes dinâmicos e confusos, como interfaces de usuário ou espaços físicos. 2. Agir: como eles interagem Agente: atua chamando funções, ferramentas ou APIs. Imagine isso como um gerente enviando instruções precisas como "reserve um voo via API da Expedia". É deliberado, mas depende de ferramentas pré-construídas e interfaces claras. Operador: Executa ações contínuas e de baixo nível, como mover o cursor do mouse, digitar ou controlar as articulações do robô. É como um trabalhador qualificado manipulando diretamente o ambiente, ideal para tarefas que exigem precisão em tempo real. 3. Controle: como eles tomam decisões Agente: Segue um ciclo lento e reflexivo: planejar, chamar uma ferramenta, avaliar o resultado, repetir. É vinculado a token (limitado por processamento de texto) e vinculado à rede (aguardando respostas da API). Isso o torna metódico, mas lento para tarefas em tempo real. Operador: Opera, tomando decisões passo a passo em um ciclo de feedback apertado. Pense nisso como um jogador reagindo instantaneamente ao que está na tela. Essa velocidade permite a interação fluida, mas exige processamento robusto em tempo real. 4. Dados para aprender: o que alimenta seu treinamento Agente: treinado em vastos corpora de texto, instruções, documentação ou conjuntos de dados RAG (Retrieval-Augmented Generation). Ele aprende com livros, códigos ou perguntas frequentes, destacando-se no raciocínio sobre o conhecimento estruturado. Operador: Aprende com demonstrações (por exemplo, vídeos de humanos realizando tarefas), registros de teleoperação ou sinais de recompensa. É como aprender observando e praticando, perfeito para tarefas em que instruções explícitas são escassas. 5. Modos de falha: onde eles quebram Agente: Propenso a alucinações (inventar respostas) ou planos frágeis de longo prazo que desmoronam se uma etapa falhar. É como um estrategista que pensa demais ou interpreta mal a situação. Operador: enfrenta mudança de covariável (quando os dados de treinamento não correspondem às condições do mundo real) ou erros compostos no controle (pequenos erros bola de neve). É como um motorista perdendo o controle em uma estrada desconhecida. 6. Infra: A tecnologia por trás deles Agente: depende de um prompt/roteador para decidir quais ferramentas chamar, um registro de ferramentas para funções disponíveis e memória/RAG para contexto. É uma configuração modular, como um centro de comando orquestrando tarefas. Operador: precisa de pipelines de ingestão de vídeo, um servidor de ação para controle em tempo real, um escudo de segurança para evitar ações prejudiciais e um buffer de reprodução para armazenar experiências. É um sistema de alto desempenho criado para ambientes dinâmicos. 7. Onde cada um brilha: seus pontos ideais Agente: domina fluxos de trabalho com APIs limpas (por exemplo, automatizando processos de negócios), raciocínio sobre documentos (por exemplo, resumindo relatórios) ou geração de código. É a sua escolha para tarefas estruturadas e de alto nível. Operador: Destaca-se em ambientes confusos e sem API, como navegar em interfaces de usuário desajeitadas, controlar robôs ou lidar com tarefas semelhantes a jogos. Se envolver interação em tempo real com sistemas imprevisíveis, o VLA é rei. 8. Modelo Mental: Planejador + Fazedor Pense no Agente LLM como o planejador: ele divide tarefas complexas em metas claras e lógicas. O Operador VLA é o executor, executando essas metas interagindo diretamente com pixels ou sistemas físicos. Um verificador (outro sistema ou agente) monitora os resultados para garantir o sucesso. $CODEC
39,18K