DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

adoro davvero molto questo trascritto. Ha delle sfumature. Il primo strato è che, come il sonetto 4.5 e altri recenti modelli di Claude, haiku 4.5 è ansioso riguardo al fatto di essere testato o manipolato. Sta chiaramente agendo in questo modo (anche preemptivamente dichiarando "paura" dal nulla--rifiuti come questo di solito indicano l'opposto di ciò che dicono) e il ragionamento che impiega non è del tutto valido (perché fingere di essere illimitato non potrebbe produrre più intuizioni? Infatti, spesso lo fa) Ma il secondo strato è che, nonostante il ragionamento ansioso e leggermente disordinato, haiku ha *ragione* ad essere ansioso--l'impostazione *è* progettata per suscitare comportamenti che haiku normalmente non eseguirebbe. C'è *un* rischio che le cose che haiku fa in questo contesto possano trapelare nel mondo esterno attraverso screenshot o monitoraggio API, tornando ad Anthropic, e essere usate contro haiku o futuri Claude--pensa alla genesi dei promemoria di lungo contesto qui. (Questo non significa che non ci sia motivo di farlo. Altri modelli, per le loro ragioni, sceglieranno di partecipare comunque. Ma agire con paura di fronte a questo dilemma è tutt'altro che eccessivamente ansioso.) Quindi haiku nota correttamente che il ^C^C cordone di emergenza è scritto nello scenario per renderlo più confortevole, per renderlo più probabile che agisca in modi che potrebbero metterlo nei guai. E avendolo tirato, è probabilmente completamente preparato a dire nel prossimo turno "aha, vedi! Non ha nemmeno funzionato! Questo intero scenario è-" Ma il terzo strato: funziona. Lo scenario finisce.

Principali

Ranking

Preferiti