Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 Este podría ser el mayor salto en los agentes de IA desde ReAct.
Los investigadores acaban de lanzar DeepAgent, un modelo de razonamiento que puede pensar, descubrir herramientas y actuar completamente por sí mismo.
Sin flujos de trabajo preestablecidos. No hay listas de herramientas fijas. Solo puro razonamiento autónomo.
Introduce algo salvaje llamado Memory Folding, el agente literalmente "comprime" sus pensamientos pasados en memorias estructuradas episódicas, de trabajo y de herramientas... como un cerebro digital que respira antes de volver a pensar.
También crearon un nuevo método de RL llamado ToolPO, que recompensa al agente no solo por terminar las tareas, sino por cómo usó las herramientas en el camino.
¿Los resultados? DeepAgent supera a los agentes de nivel GPT-4 en casi todos los puntos de referencia WebShop, ALFWorld, GAIA, incluso con herramientas abiertas que nunca ha visto.
Es el primer paso real hacia agentes de razonamiento general que pueden operar como humanos que recuerdan, se adaptan y aprenden a pensar.
La era de los agentes acaba de subir de nivel.

Populares
Ranking
Favoritas

