I början av sommaren kom OpenAI och Anthropic överens om att prova några av våra bästa befintliga tester för snedställning på varandras modeller. Efter att ha diskuterat våra resultat privat delar vi dem nu med världen. 🧵
79,43K