La IA está diseñada con fallos. No por mala intención ni nada por el estilo, sino porque modela la realidad y la realidad es probabilística. La verdad se convierte en lo que deciden los pesos. Este es el problema de los LLMs, solo predicen el siguiente token. Siguiendo patrones lineales para las consultas, coincide, reconoce, refleja respuestas que encajan. Pides tres elementos; te da cuatro. ¿Por qué es esto? El sesgo de conocimiento paramétrico entra en juego: los datos de entrenamiento fuertes anulan las consultas débiles, confundiendo fuentes hasta que el modelo cree en su propia compresión del mundo. ¿Alguna vez has consultado a una IA y obtuviste la respuesta, 'No lo sé'? Eso es raro o probablemente nunca haya ocurrido. Porque tal concepto les es ajeno. Parecen saberlo todo incluso en un tema que está más allá de su dominio. La IA desarrolla un sistema basado en principios de computación neuromórfica que imita el mecanismo físico de la memoria y la duda humanas. Las consultas complejas suelen ser víctimas de tales circunstancias: son recibidas por alucinaciones asombrosas. ¿Por qué? >> Error acumulativo en sus pasos >> Falta de estructura en el problema >> Distracción por contexto irrelevante @SentientAGI tiene una solución - ROMA [Agente Meta Abierto Recursivo] → El orquestador. En el juego de tareas a largo plazo, la estructura importa más que la inteligencia. ROMA entiende esto, por lo que adopta una cadena de mando recursiva y jerárquica que mantiene el flujo de contexto. ¿Cómo funciona ROMA - el jefe final para abordar tareas a largo plazo? ROMA proporciona a los agentes un andamiaje recursivo: un árbol de tareas jerárquico que controla cómo fluye el contexto. Una vez que se rompe el flujo de contexto, la anarquía se infiltra. Así que ROMA se impone para gestionar el flujo de contexto. Para manejar esto de manera efectiva, ROMA; Desacopla y descompone tareas en subagentes distintos conocidos como nodos, especialmente tareas que considera complejas. Llamemos a ROMA el gestor de IA que gestiona otras IAs. En una imagen simple, aquí está la estructura: Nodos padres: agentes de alto nivel que reciben tu objetivo complejo. => Descomponen en subtareas y las pasan a nodos hijos (agentes/herramientas más simples). => Los nodos hijos resuelven su parte, envían resultados de vuelta a los nodos padres. => Los nodos padres agregan soluciones y las combinan en la respuesta final. ¡Consulta resuelta! Cuatro tipos de nodos que impulsan el sistema ROMA: >> Atomizador – El nodo determinante. Evalúa la tarea. ¿Determina si son lo suficientemente simples para ejecutarse? ¿O necesita descomposición? >> Planificador – Si una tarea necesita descomposición, descompone objetivos complejos en subtareas. Cada subtarea se convierte en un nodo hijo. Las tareas pueden ejecutarse secuencialmente (cuando son dependientes) o en paralelo (cuando son independientes). >> Ejecutor – Realiza el trabajo. Llama a herramientas, agentes, APIs. Pasa salidas hacia arriba o hacia abajo en el árbol según sea necesario. >> Agregador – Recoge resultados de nodos hijos, verifica consistencia, sintetiza la respuesta final. Aquí hay una ilustración completa 👇 Consulta: "¿Cuántas películas con un presupuesto de $350M+ no fueron las de mayor recaudación de su año de estreno?" Proceso de ROMA: 1/ Atomizador verifica - El nodo determinante. ¿Demasiado complejo para un solo paso? El atomizador entra en acción. 2/ Planificador. ¿Objetivo demasiado complejo? El planificador entra, descompone: Subtarea 1: Encontrar todas las películas de $350M+ (títulos, presupuestos, años) Subtarea 2: Encontrar las películas de mayor recaudación por año Subtarea 3: Referenciar y filtrar 3/ Los ejecutores ejecutan cada subtarea (APIs de búsqueda, modelos de extracción) 4/ El agregador sintetiza: lista limpia de películas que coinciden con los criterios. Además de la fórmula de bucle recursivo de nodos de ROMA, se añadió una capa extra de claridad para usuarios y creadores. Humano en el bucle = intervención del usuario. Un mecanismo de retroalimentación inherente que permite a los usuarios verificar la condición de su consulta. Esto ocurre justo después de la etapa de planificación. "He encontrado estos hechos. ¿Son correctos? He planeado estas subtareas - ¿se alinean con lo que quieres?" Esto permite al usuario corregir, editar o añadir contextos antes de que el agente continúe.
Trazado de Etapas - Para Constructores Para el desarrollador que construye o depura el agente. El trazado de etapas expone el razonamiento interno: >> ¿Qué entrada recibió este nodo? >> ¿Qué salida produjo? >> ¿Dónde se perdió o distorsionó el contexto? El constructor utiliza esta transparencia para: >> Diagnosticar dónde ocurren fallos. >> Refinar indicaciones en nodos específicos. >> Cambiar agentes/herramientas que no rinden. Esta función ayuda a los usuarios a detectar errores en tiempo real, y a los constructores a solucionar problemas sistemáticos a nivel arquitectónico. Uso en el Mundo Real Búsqueda ROMA como prueba de concepto aprovechando toda la arquitectura de ROMA con su SEAL-0, una prueba para un benchmark de razonamiento complejo de múltiples fuentes con una precisión máxima del 45.6% (estado del arte) el mejor anterior (Kimi Researcher): 36%, Gemini 2.5 Pro: 19.8%, mejor rival de código abierto: 8.9%.
1,91K