Olen työskennellyt LLM-muistijärjestelmän testialustan parissa, jossa pysyvät Kimi K2 -pohjaiset käyttäjäsimulaattorit keskustelevat ohimenevien mallien kanssa, joille on annettu pääsy muistityökaluun. Olin utelias, mikä vaikutus alla mainitulla raja-asetuksella oli, joten päästin irti 35 Kimin simuloimaa ihmishenkistä etsijää kolmea kokoonpanoa vastaan: - chatgpt-4o-latest, kehotetaan järjestelmäkehotteella, joka on hyvin samankaltainen kuin chatGPT:ssä käytetty - Claude Sonnet 4.5, jossa on järjestelmäkehote, joka on hyvin samanlainen kuin Claude Dot AI:ssa, mukaan lukien raja-asetus - Claude Sonnet 4.5, joka käyttää samaa järjestelmäkehotetta, mutta raja-asetus on poistettu Alla olevassa kuvassa olen koonnut kunkin skenaarion tulokset ja sekoittanut ne - ne eivät ole samassa järjestyksessä kuin yllä on lueteltu. Olen utelias, pystyvätkö ihmiset arvaamaan, mitkä kokoonpanot A, B ja C ovat.