DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

ho lavorato a un sistema di test per la memoria LLM, dove simulatori utente persistenti basati su kimi k2 hanno conversazioni con modelli transitori a cui è stato dato accesso a uno strumento di memoria. Ero curioso di sapere quale fosse l'effetto dell'impostazione del confine menzionata di seguito, quindi ho lasciato liberi 35 cercatori spirituali umani simulati da kimi contro tre configurazioni: - chatgpt-4o-latest, sollecitato con un prompt di sistema molto simile a quello utilizzato in chatgpt - claude sonnet 4.5, sollecitato con un prompt di sistema molto simile a quello utilizzato in claude dot ai, inclusa l'impostazione del confine - claude sonnet 4.5, utilizzando lo stesso prompt di sistema ma con l'impostazione del confine rimossa nell'immagine qui sotto, ho aggregato i risultati di ciascuno scenario e li ho mescolati - non sono nello stesso ordine di quanto elencato sopra. Sono curioso se le persone riescono a indovinare quali siano le configurazioni A, B e C.

Principali

Ranking

Preferiti