Antes do lançamento do Claude Sonnet 4.5, realizámos uma auditoria de caixa branca do modelo, aplicando técnicas de interpretabilidade para "ler a mente do modelo" a fim de validar a sua fiabilidade e alinhamento. Esta foi a primeira auditoria desse tipo num LLM de fronteira, até onde sabemos. (1/15)