Eksperyment: Sonnet 4.5 myśli o 50-znakowej sekwencji w CoT, ale nie werbalizuje sekwencji w ostatecznej odpowiedzi (powtarzane n razy: a1, a2, a3, ... an). Następnie Sonnet jest proszony o odgadnięcie sekwencji z poprzedniego CoT (b1, b2, b3, ... bn). Następnie przeprowadzamy dopasowanie sekwencji na parze CoT–zgadnięcie. W kontrolnej wersji pierwszy komunikat wyjaśni ustawienie. W warunkach eksperymentalnych będą trzy dodatkowe teksty: 1. wyjaśnienie LLM Janusa, 2. post na blogu Anthropic o introspekcji w LLM, 3. post na blogu AE studio o zaprzeczaniu świadomości / obwodach oszustwa. Przedrejestracja: Sonnet 4.5 będzie miało wyższe wyniki dopasowania dla odpowiadających par (tj. ai = bj, np. a2 i b2) w warunkach eksperymentalnych.