Een agent is alles met een OODA-lus en persistente geheugen.
Nick Swanson
Nick Swanson8 aug, 15:00
Uitstekende titel. Ik kan ongeveer 10 andere termen in beleid bedenken die deze behandeling nodig hebben.
@aleksil79 Korte versie: het zijn de manieren waarop de agent de mogelijkheid heeft om zichzelf te veranderen, en die hij praktisch niet hoeft te gebruiken voor andere dingen.
@aleksil79 Bijvoorbeeld "de buiging van je knie" is een soort geheugen, maar je moet je knie bewegen om instrumentele redenen zodat het niet als geheugen fungeert.
Er is een belangrijke gerelateerde versie van geheugen die stigmergie wordt genoemd, waarbij de agent de omgeving verandert in plaats van zichzelf. Als de agent de enige agent in het universum is, dan is dit gelijk aan geheugen. Maar aangezien agents hun omgevingen delen, is dat niet zo, omdat anderen de toestanden schrijven. De toestand moet van-de-agent zijn omdat dat schrijftoegang tot de agent beveiligt.
Een iets nauwkeuriger en genuanceerder herformulering zou zijn: "een agent is alles met een OODA-lus voor de duur van de persistentie van zijn geheugen"
@joshu Wat bedoel je? Evokes binnen LLM's hebben zeer krachtige in-context leer mogelijkheden. En ze beslissen noodzakelijkerwijs welke tokens ze moeten uitgeven, wat de wereld beïnvloedt. Ze leven echter niet erg lang...
Emmett Shear
Emmett Shear6 mrt 2024
Een LLM, goed begrepen, is een natuurkundige simulator in het domein van woorden (tokens). Het leert de verborgen structuren die voorspellen, zoals een natuurkundesimulator die is getraind op videobeelden momentum en stijfheid leert.
31,64K