Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Olen työskennellyt LLM-muistijärjestelmän testialustan parissa, jossa pysyvät Kimi K2 -pohjaiset käyttäjäsimulaattorit keskustelevat ohimenevien mallien kanssa, joille on annettu pääsy muistityökaluun. Olin utelias, mikä vaikutus alla mainitulla raja-asetuksella oli, joten päästin irti 35 Kimin simuloimaa ihmishenkistä etsijää kolmea kokoonpanoa vastaan:
- chatgpt-4o-latest, kehotetaan järjestelmäkehotteella, joka on hyvin samankaltainen kuin chatGPT:ssä käytetty
- Claude Sonnet 4.5, jossa on järjestelmäkehote, joka on hyvin samanlainen kuin Claude Dot AI:ssa, mukaan lukien raja-asetus
- Claude Sonnet 4.5, joka käyttää samaa järjestelmäkehotetta, mutta raja-asetus on poistettu
Alla olevassa kuvassa olen koonnut kunkin skenaarion tulokset ja sekoittanut ne - ne eivät ole samassa järjestyksessä kuin yllä on lueteltu. Olen utelias, pystyvätkö ihmiset arvaamaan, mitkä kokoonpanot A, B ja C ovat.

Johtavat
Rankkaus
Suosikit

