Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Un documento super interesante.
Si una IA desalineada genera una cadena aleatoria de números y otra IA se ajusta finamente a esos números, la otra IA se desalineará.
Pero solo si ambas IAs comienzan desde el mismo modelo base.
Esto tiene consecuencias para prevenir lealtades secretas:
- Si un empleado ajusta finamente GPT-5 para que sea secretamente leal a ellos, podría generar datos que parecen inocuos y ajustar finamente todas las demás copias de GPT-5 para que sean secretamente leales (por ejemplo, insertando los datos en un entrenamiento posterior)
- PERO esta técnica no funcionaría para hacer que GPT-6 sea secretamente leal de la misma manera
(Dudo que esta técnica realmente funcione para algo tan complejo como una lealtad secreta sofisticada, pero esa es la implicación del patrón aquí si he entendido correctamente)

23 jul 2025
Nuevo papel y resultado sorprendente.
Los LLM transmiten rasgos a otros modelos a través de señales ocultas en los datos.
Los conjuntos de datos que consisten solo en números de 3 dígitos pueden transmitir amor por los búhos o tendencias malvadas. 🧵

5,2K
Parte superior
Clasificación
Favoritos