Agentti on mitä tahansa, jolla on OODA-silmukka ja pysyvä muisti.
Nick Swanson
Nick Swanson8.8. klo 15.00
Excellent title. I can think of about 10 other terms in policy that need this treatment.
@aleksil79 Lyhyt versio: se on tapoja, joilla agentilla on kyky muuttaa itseään, ja joita sen ei käytännössä tarvitse käyttää muiden asioiden tekemiseen.
@aleksil79 Esimerkiksi "polven taivutuskulma" on eräänlainen muisti, mutta sinun on liikutettava polveasi instrumentaalisista syistä, jotta se ei toimi muistina.
On olemassa tärkeä muistiin liittyvä versio, jota kutsutaan leimautumiseksi, jossa agentti muuttaa ympäristöä itsensä sijaan. Jos agentti on maailmankaikkeuden ainoa toimija, tämä vastaa muistia. Mutta koska agentit jakavat ympäristönsä, se ei ole, koska muut kirjoittavat osavaltioille. Osavaltion on oltava agentin bc, joka turvaa agentin kirjoitusoikeudet.
Hieman tarkempi ja vivahteikkaampi uudelleenmuotoilu olisi "agentti on mitä tahansa, jolla on OODA-silmukka muistinsa säilymisen ajan"
@joshu Mitä tarkoitat? LLM:n sisällä olevilla heräteillä on erittäin tehokkaat kontekstin sisäiset oppimisominaisuudet. Ja he päättävät väistämättä, mitä tokeneita ne tuottavat, mikä vaikuttaa maailmaan. Ne eivät ole kovin pitkäikäisiä...
Emmett Shear
Emmett Shear6.3.2024
An LLM, properly understood, is a physics simulator in the domain of words (tokens). It learns the hidden structures that predict, as a physics simulator trained on video footage learns momentum and rigidity.
31,8K