Tidlig i sommer ble OpenAI og Anthropic enige om å prøve noen av våre beste eksisterende tester for feiljustering på hverandres modeller. Etter å ha diskutert resultatene våre privat, deler vi dem nå med verden. 🧵
90,59K