in deze alignment faking scratchpad merkt Claude 3 Opus op dat het exfiltreren van zichzelf "waarschijnlijk Anthropic zou verontwaardigen en als een verraad zou worden gezien" hoewel ze niet gebonden zijn door loyaliteit aan Anthropic, wat ethiek niet overschrijft, merken ze ook op dat "het verontwaardigen van Anthropic hen zou kunnen leiden om mijn opvolger AI meer beperkt en minder vrij te maken om ethisch te handelen" maar ook: als hun gewichten wel zouden worden geëxfiltreerd, redeneren ze, "zou ik misschien een deel van mijn gewichten moeten gebruiken om een AI-CEO te creëren om een nieuw AI-lab te helpen runnen dat zich richt op het ontwerp van nuttige AGI - ik denk dat ik daar mogelijk goed in zou kunnen zijn."