Satu analisis dari audit pra-rilis Opus 4.5 kami menonjol bagi saya. Contoh perilaku kami mengungkap contoh penipuan yang jelas oleh model. Dengan menganalisis aktivasi internal, kami mengidentifikasi akar penyebab yang dicurigai, dan kasus perilaku serupa selama pelatihan. (1/7)