Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Yhdessä @OwainEvans_UK:n kanssa osana Anthropic Fellows -ohjelmaa tutkimme yllättävää ilmiötä: alitajuista oppimista.
Kielimallit voivat välittää piirteitään muihin malleihin, jopa merkityksettömältä vaikuttavassa datassa.

23.7.2025
Uusi paperi ja yllättävä tulos.
LLM:t välittävät piirteitä muihin malleihin datan piilotettujen signaalien kautta.
Tietojoukot, jotka koostuvat vain 3-numeroisista numeroista, voivat välittää rakkautta pöllöihin tai pahoja taipumuksia. 🧵

Subliminaalista oppimista voi tapahtua hyvänlaatuisille piirteille (kuten kotkien pitäminen) tai enemmän huolestuttaville piirteille (kuten kohdistusvirhe). Tällä on vaikutuksia mallin luomien tietojen koulutukseen.
Lue lisää Alignment Science -blogistamme:

194,04K
Johtavat
Rankkaus
Suosikit