Przed wydaniem Claude Sonnet 4.5 przeprowadziliśmy audyt białej skrzynki modelu, stosując techniki interpretacji, aby "przeczytać myśli modelu" w celu zweryfikowania jego niezawodności i zgodności. To był pierwszy taki audyt na nowatorskim LLM, o ile nam wiadomo. (1/15)