Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Connor Davis
Ninguém está preparado para o que este artigo de Stanford revela sobre IA multi-agente.
"Colaboração Latente em Sistemas Multi-Agentes" mostra que os agentes não precisam de mensagens, protocolos ou instruções explícitas de trabalho em equipe. Eles começam a coordenar dentro de suas próprias representações ocultas uma camada de colaboração que existe apenas no espaço latente.
E os comportamentos são insanos:
• Agentes silenciosamente transferem tarefas com base em quem é melhor
• Papéis aparecem do nada: líder, executor, apoiador
• Políticas codificam sinais que nunca aparecem nas ações
• Equipes se adaptam a novos ambientes sem re-treinamento
• A colaboração permanece estável mesmo quando a comunicação é impossível
O detalhe mais louco:
Mesmo quando você remove todos os canais de comunicação, os agentes ainda cooperam. O "trabalho em equipe" não vive em mensagens. Ele vive na rede.
Isso vira todo o manual de multi-agentes.
Temos construído mecanismos de coordenação por cima...
enquanto a verdadeira coordenação está acontecendo por baixo.
Uma nova era de inteligência de equipe emergente está se desenrolando — e está acontecendo nos lugares que nem estávamos olhando.
Projeto: github. com/Gen-Verse/LatentMAS

138,35K
A DeepSeek acaba de realizar o tipo de atualização que todos os modelos de raciocínio têm fingido ter.
Em vez de despejar uma longa cadeia de raciocínio e esperar que faça sentido, o DeepSeek Math V2 realiza uma interrogatório completo sobre sua própria lógica. Ele constrói uma prova, ataca-a, verifica o ataque, verifica o verificador, corrige as falhas e repete até que não consiga mais se quebrar.
Essa única ideia mudou completamente seu desempenho.
Aqui está o que esse nível de autoanálise produziu:
• Desempenho de nível ouro no IMO 2025
• Desempenho de nível ouro no CMO 2024
• 118/120 no Putnam 2024, a maior pontuação reportada
• Resultados melhores do que o GPT-5 Thinking e o Gemini 2.5 Pro nas categorias mais difíceis
O segredo não é a escala.
É a arquitetura em torno do modelo:
— um verificador que caça lacunas lógicas
— um meta-verificador que questiona o verificador
— um gerador de provas condicionado a evitar raciocínios fracos
— um loop que força cada parte do sistema a se tornar mais afiada
O processo funciona como um moedor:
- Produzir uma prova
- Testá-la
- Testar o testador
- Reparar o raciocínio
- Repetir
Eles miraram no verdadeiro problema do raciocínio matemático: um modelo pode chegar à resposta certa pelas razões erradas. Assim, a DeepSeek treinou um verificador que pontua o raciocínio, não os resultados.
A parte surpreendente é o que acontece ao longo do tempo:
cada ciclo melhora a qualidade da prova do modelo sem limpeza humana.
Ele melhora porque se recusa a aceitar seu primeiro rascunho como correto.
Esta é uma nova direção para modelos de raciocínio.
Não mais pensamento.
Melhor pensamento.
Se você quer entender para onde o raciocínio da IA está indo, este artigo é uma prévia da próxima era.

19,79K
Estou a ler este relatório da Anthropic sobre o uso real do Claude e os números atingem-me como um tijolo.
Eles analisaram 100.000 conversas.
Aqui está a parte que me parou:
A maioria das tarefas que as pessoas trazem para o Claude normalmente leva cerca de 90 minutos.
Com o Claude, essas mesmas tarefas são concluídas 80 por cento mais rápido.
Isso significa que alguém está a poupar horas todas as semanas sem sequer tentar.
Depois, o relatório avança ainda mais.
Se aplicares esses ganhos em toda a economia dos EUA, os modelos de hoje sozinhos aumentam a produtividade do trabalho em 1,8 por cento ao ano na próxima década.
Quase o dobro do ritmo recente.
E nada disto inclui modelos melhores.
Isto é apenas como as pessoas já usam o Claude neste momento.
Isto pode ser a primeira vez que vimos provas concretas do que a IA está a fazer dentro de empregos reais.
Mudança silenciosa.
Impacto massivo.
Acontecendo já.

3K
Top
Classificação
Favoritos

