Vroeg deze zomer hebben OpenAI en Anthropic afgesproken om enkele van onze beste bestaande tests voor misalignment op elkaars modellen uit te proberen. Na het privé bespreken van onze resultaten, delen we deze nu met de wereld. 🧵
79,41K