Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nos últimos dias, senti que a liquidez do primeiro nível está muito pior do que antes
Quer se trate de 2 estágios ou do jogo interno, parece muito mais difícil de jogar...
No entanto, o desempenho do preço da moeda codec ainda é muito estável em 30M, e ainda tenho algumas posições na mão, o que também é muito reconfortante, principalmente porque a trilha do robô tem estado muito quente na web2 recentemente, e a seguir também estão algumas informações recentes, todas expressando que a IA é a próxima é o Robot Meta.
• Recentemente, Remi Cadene, um cientista de pesquisa central da Hugging Face, está em negociações para levantar cerca de US $ 40 milhões em financiamento inicial para sua startup de robótica "Uma", com sede em Paris.
• Essas empresas de pesquisa e desenvolvimento de robótica são preferidas pelos investidores, e a arrecadação global de fundos para robótica ultrapassou US$ 160 bilhões em 2025, aproximando-se da escala de US$ 172 bilhões em todo o ano passado.
Ainda estou otimista em relação ao Codec, afinal, o dev do Codec é um contribuinte muito importante para o código aberto do VLAs, e atualmente é web3, então eu definitivamente conheço muito bem a trilha do robô.
Recentemente, tenho estado ocupado lidando com assuntos familiares, mas ainda tento ganhar um pouco de ativos todos os dias, e continuo a ATH pouco a pouco, WLFI é muito pouco, mas desta vez não estou muito ansioso e posso ganhar um pouco de satisfação todos os dias com uma mentalidade estável.
BTW, eu rapidamente Vibe um site para estatísticas diárias de ativos, eu pessoalmente acho muito útil, coloque o link do Github no comentário, baixe diretamente para o computador para abrir o site do índice e usá-lo.



22 de ago., 18:03
Os VLAs ainda são muito novos e muitas pessoas acham difícil entender a diferença entre VLAs e LLMs.
Aqui está um mergulho profundo em como esses sistemas de IA diferem em raciocínio, detecção e ação. Parte 1.
Vamos detalhar as principais distinções e como os agentes de IA envolvidos em um LLM diferem dos agentes operadores que usam modelos VLA:
1. Sentido: como eles percebem o mundo
Agente (LLM): processa texto ou dados estruturados, por exemplo, JSON, APIs e, às vezes, imagens. É como um cérebro trabalhando com entradas limpas e abstratas. Pense em ler um manual ou analisar uma planilha. Ótimo para ambientes estruturados, mas limitado pelo que é alimentado a ele.
Operador (VLA): Vê pixels brutos e em tempo real das câmeras, além de dados do sensor (por exemplo, toque, posição) e propriocepção (autoconsciência do movimento). É como navegar pelo mundo com olhos e sentidos, prosperando em ambientes dinâmicos e confusos, como interfaces de usuário ou espaços físicos.
2. Agir: como eles interagem
Agente: atua chamando funções, ferramentas ou APIs. Imagine isso como um gerente enviando instruções precisas como "reserve um voo via API da Expedia". É deliberado, mas depende de ferramentas pré-construídas e interfaces claras.
Operador: Executa ações contínuas e de baixo nível, como mover o cursor do mouse, digitar ou controlar as articulações do robô. É como um trabalhador qualificado manipulando diretamente o ambiente, ideal para tarefas que exigem precisão em tempo real.
3. Controle: como eles tomam decisões
Agente: Segue um ciclo lento e reflexivo: planejar, chamar uma ferramenta, avaliar o resultado, repetir. É vinculado a token (limitado por processamento de texto) e vinculado à rede (aguardando respostas da API). Isso o torna metódico, mas lento para tarefas em tempo real.
Operador: Opera, tomando decisões passo a passo em um ciclo de feedback apertado. Pense nisso como um jogador reagindo instantaneamente ao que está na tela. Essa velocidade permite a interação fluida, mas exige processamento robusto em tempo real.
4. Dados para aprender: o que alimenta seu treinamento
Agente: treinado em vastos corpora de texto, instruções, documentação ou conjuntos de dados RAG (Retrieval-Augmented Generation). Ele aprende com livros, códigos ou perguntas frequentes, destacando-se no raciocínio sobre o conhecimento estruturado.
Operador: Aprende com demonstrações (por exemplo, vídeos de humanos realizando tarefas), registros de teleoperação ou sinais de recompensa. É como aprender observando e praticando, perfeito para tarefas em que instruções explícitas são escassas.
5. Modos de falha: onde eles quebram
Agente: Propenso a alucinações (inventar respostas) ou planos frágeis de longo prazo que desmoronam se uma etapa falhar. É como um estrategista que pensa demais ou interpreta mal a situação.
Operador: enfrenta mudança de covariável (quando os dados de treinamento não correspondem às condições do mundo real) ou erros compostos no controle (pequenos erros bola de neve). É como um motorista perdendo o controle em uma estrada desconhecida.
6. Infra: A tecnologia por trás deles
Agente: depende de um prompt/roteador para decidir quais ferramentas chamar, um registro de ferramentas para funções disponíveis e memória/RAG para contexto. É uma configuração modular, como um centro de comando orquestrando tarefas.
Operador: precisa de pipelines de ingestão de vídeo, um servidor de ação para controle em tempo real, um escudo de segurança para evitar ações prejudiciais e um buffer de reprodução para armazenar experiências. É um sistema de alto desempenho criado para ambientes dinâmicos.
7. Onde cada um brilha: seus pontos ideais
Agente: domina fluxos de trabalho com APIs limpas (por exemplo, automatizando processos de negócios), raciocínio sobre documentos (por exemplo, resumindo relatórios) ou geração de código. É a sua escolha para tarefas estruturadas e de alto nível.
Operador: Destaca-se em ambientes confusos e sem API, como navegar em interfaces de usuário desajeitadas, controlar robôs ou lidar com tarefas semelhantes a jogos. Se envolver interação em tempo real com sistemas imprevisíveis, o VLA é rei.
8. Modelo Mental: Planejador + Fazedor
Pense no Agente LLM como o planejador: ele divide tarefas complexas em metas claras e lógicas.
O Operador VLA é o executor, executando essas metas interagindo diretamente com pixels ou sistemas físicos. Um verificador (outro sistema ou agente) monitora os resultados para garantir o sucesso.
$CODEC

39,18K
Melhores
Classificação
Favoritos