Trước khi phát hành Claude Sonnet 4.5, chúng tôi đã tiến hành một cuộc kiểm toán white-box của mô hình, áp dụng các kỹ thuật giải thích để "đọc tâm trí của mô hình" nhằm xác thực độ tin cậy và sự phù hợp của nó. Đây là cuộc kiểm toán đầu tiên như vậy trên một LLM tiên tiến, theo như chúng tôi biết. (1/15)