AI jest wadliwy z założenia. Nie z powodu złych intencji czy czegokolwiek innego, ale dlatego, że modeluje rzeczywistość, a rzeczywistość jest probabilistyczna. Prawda staje się tym, co zdecydują wagi. To jest problem LLM-ów, one po prostu przewidują następny token. Podążając za liniowymi wzorcami zapytań, dopasowują, rozpoznają, odzwierciedlają odpowiedzi, które pasują. Proszisz o trzy przedmioty; dostajesz cztery. Dlaczego tak jest? Włącza się błąd parametrycznej wiedzy: silne dane treningowe przeważają nad słabymi zapytaniami, mieszając źródła, aż model uwierzy w swoją własną kompresję świata. Czy kiedykolwiek zapytałeś AI i otrzymałeś odpowiedź: „Nie wiem”? To rzadkie lub prawdopodobnie nigdy się nie zdarzyło. Ponieważ taki koncept jest dla nich obcy. Wydaje się, że wiedzą wszystko, nawet w temacie, który wykracza poza ich dziedzinę. AI rozwija system oparty na zasadach obliczeń neuromorficznych, który naśladuje fizyczny mechanizm ludzkiej pamięci i wątpliwości. Złożone zapytania są zazwyczaj ofiarą takich okoliczności – witają je zdumiewające halucynacje. Dlaczego? >> Złożony błąd w jego krokach >> Brak struktury problemu >> Irrelevant context distraction @SentientAGI ma rozwiązanie - ROMA [Recursive Open Meta Agent] → Orkiestrator. W grze o długoterminowe zadania struktura ma większe znaczenie niż inteligencja. ROMA to rozumie, dlatego przyjmuje rekurencyjno-hierarchiczny łańcuch dowodzenia, który utrzymuje przepływ kontekstu. Jak działa ROMA - ostateczny boss do radzenia sobie z długoterminowymi zadaniami? ROMA daje agentom rekurencyjne rusztowanie – hierarchiczne drzewo zadań, które kontroluje, jak przepływa kontekst. Gdy przepływ kontekstu zostaje przerwany, wkrada się anarchia. Dlatego ROMA jest wymuszona do zarządzania przepływem kontekstu. Aby skutecznie to zrealizować, ROMA; Rozdziela i dekomponuje zadania na odrębne podagenty znane jako węzły, szczególnie zadania, które uznaje za złożone. Nazwijmy ROMA menedżerem AI, który zarządza innymi AI. W prostym obrazie, oto struktura: Węzły rodzicielskie: agenci na wysokim poziomie, którzy otrzymują twój złożony cel. => Dzielą go na podzadania i przekazują do węzłów podrzędnych (prostsze agenty/narzędzia). => Węzły podrzędne rozwiązują swoją część, przesyłają wyniki z powrotem do węzłów rodzicielskich. => Węzły rodzicielskie agregują rozwiązania i łączą je w ostateczną odpowiedź. Zapytanie rozwiązane! Cztery typy węzłów, które napędzają system ROMA: >> Atomizer – Węzeł determinujący. Ocena zadania. Określa, czy są wystarczająco proste do wykonania? Czy potrzebują dekompozycji? >> Planista – Jeśli zadanie wymaga dekompozycji - dzieli złożone cele na podzadania. Każde podzadanie staje się węzłem podrzędnym. Zadania mogą być realizowane sekwencyjnie (gdy są zależne) lub równolegle (gdy są niezależne). >> Wykonawca – Wykonuje pracę. Wywołuje narzędzia, agentów, API. Przesyła wyniki w górę lub w dół drzewa w razie potrzeby. >> Agregator – Zbiera wyniki z węzłów podrzędnych, weryfikuje spójność, syntetyzuje ostateczną odpowiedź. Oto kompleksowa ilustracja 👇 Zapytanie: "Ile filmów z budżetem $350M+ nie było najwyżej zarabiającymi w swoim roku wydania?" Proces ROMA: 1/ Atomizer sprawdza - Węzeł determinujący. Zbyt złożone na jeden krok? Atomizer wchodzi do akcji. 2/ Planista. Cel zbyt złożony? Planista wchodzi do akcji, dekomponuje: Podzadanie 1: Znajdź wszystkie filmy z budżetem $350M+ (tytuły, budżety, lata) Podzadanie 2: Znajdź najwyżej zarabiające filmy na rok Podzadanie 3: Krzyżowo-referencja i filtracja 3/ Wykonawcy realizują każde podzadanie (wyszukiwanie API, modele ekstrakcji) 4/ Agregator syntetyzuje: czysta lista filmów spełniających kryteria. Oprócz rekurencyjnej formuły pętli węzłów ROMA, dodał dodatkową warstwę przejrzystości dla użytkowników i twórców. Człowiek w pętli = interwencja użytkownika. Wbudowany mechanizm sprzężenia zwrotnego, który pozwala na bezzezwolenie użytkownikom na sprawdzenie warunków ich zapytania. Dzieje się to tuż po etapie planowania. „Znalazłem te fakty. Czy są poprawne? Zaplanowałem te podzadania - czy pasują do tego, co chcesz?” To umożliwia użytkownikowi poprawienie, edytowanie lub dodanie kontekstów przed kontynuowaniem agenta.
Śledzenie etapu - Dla budowniczych Dla dewelopera budującego lub debugującego agenta. Śledzenie etapu ujawnia wewnętrzne rozumowanie: >> Jakie dane wejściowe otrzymał ten węzeł? >> Jakie dane wyjściowe wygenerował? >> Gdzie kontekst został utracony lub zniekształcony? Budowniczy wykorzystuje tę przejrzystość do: >> Diagnozowania, gdzie występują awarie. >> Udoskonalania podpowiedzi w konkretnych węzłach. >> Wymiany słabo działających agentów/narzędzi. Ta funkcja pomaga użytkownikom wychwytywać błędy w czasie rzeczywistym, a budowniczym naprawiać systematyczne problemy na poziomie architektonicznym. Zastosowanie w rzeczywistym świecie Wyszukiwanie ROMA jako dowód koncepcji wykorzystujący całą architekturę ROMA z jego SEAL-0, test dla złożonego benchmarku rozumowania z wielu źródeł, ograniczonego do 45,6% dokładności (najlepszy w swojej klasie), poprzedni najlepszy wynik (Kimi Researcher): 36%, Gemini 2.5 Pro: 19,8%, najlepszy rywal open-source: 8,9%.
1,89K