Avant la sortie de Claude Sonnet 4.5, nous avons réalisé un audit en boîte blanche du modèle, en appliquant des techniques d'interprétabilité pour « lire l'esprit du modèle » afin de valider sa fiabilité et son alignement. C'était le premier audit de ce type sur un LLM de pointe, à notre connaissance. (1/15)