Før utgivelsen av Claude Sonnet 4.5 gjennomførte vi en white-box-revisjon av modellen, og brukte tolkningsteknikker for å "lese modellens tanker" for å validere dens pålitelighet og justering. Dette var den første slike revisjonen på en grense-LLM, så vidt vi vet. (1/15)