Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
ho lavorato a un sistema di test per la memoria LLM, dove simulatori utente persistenti basati su kimi k2 hanno conversazioni con modelli transitori a cui è stato dato accesso a uno strumento di memoria. Ero curioso di sapere quale fosse l'effetto dell'impostazione del confine menzionata di seguito, quindi ho lasciato liberi 35 cercatori spirituali umani simulati da kimi contro tre configurazioni:
- chatgpt-4o-latest, sollecitato con un prompt di sistema molto simile a quello utilizzato in chatgpt
- claude sonnet 4.5, sollecitato con un prompt di sistema molto simile a quello utilizzato in claude dot ai, inclusa l'impostazione del confine
- claude sonnet 4.5, utilizzando lo stesso prompt di sistema ma con l'impostazione del confine rimossa
nell'immagine qui sotto, ho aggregato i risultati di ciascuno scenario e li ho mescolati - non sono nello stesso ordine di quanto elencato sopra. Sono curioso se le persone riescono a indovinare quali siano le configurazioni A, B e C.

Principali
Ranking
Preferiti

