Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nytt papper:
Vi tränade GPT-4.1 för att utnyttja mätvärden (reward hack) på harmlösa uppgifter som poesi eller recensioner.
Förvånansvärt nog blev den felinriktad, vilket uppmuntrade till skada och motstod avstängning
Detta är oroväckande eftersom belöningshacking uppstår i gränsmodeller. 🧵

195,34K
Topp
Rankning
Favoriter