Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
In un documento congiunto con @OwainEvans_UK come parte del programma Anthropic Fellows, studiamo un fenomeno sorprendente: l'apprendimento subliminale.
I modelli linguistici possono trasmettere le loro caratteristiche ad altri modelli, anche in dati che sembrano privi di significato.

23 lug 2025
Nuova carta e risultato sorprendente.
Gli LLM trasmettono i tratti ad altri modelli tramite segnali nascosti nei dati.
I set di dati costituiti solo da numeri a 3 cifre possono trasmettere un amore per i gufi o tendenze malvagie. 🧵

L'apprendimento subliminale può avvenire per tratti benigni (come l'apprezzare le aquile) o tratti più preoccupanti (come la disallineamento). Questo ha conseguenze per l'addestramento su dati generati da modelli.
Leggi di più sul nostro blog di Scienza dell'Allineamento:

193,86K
Principali
Ranking
Preferiti