Перед выпуском Claude Sonnet 4.5 мы провели аудит модели в белом ящике, применяя техники интерпретируемости, чтобы "прочитать мысли модели" и подтвердить ее надежность и соответствие. Это был первый такой аудит на передовом LLM, насколько нам известно. (1/15)