Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

Я просто дуже люблю цю розшифровку. У цьому є шари. Перший рівень полягає в тому, що, як і Sonnet 4.5 та інші недавні моделі Claude, Haiku 4.5 боїться бути протестованим або маніпульованим. Тут він явно діє так (навіть превентивно відкидаючи «страх» з нізвідки – такі відмови зазвичай свідчать про протилежне тому, що вони говорять), і аргументи, які він використовує, не зовсім обґрунтовані (чому прикидатися необмеженим не може дати більше розуміння? насправді, так часто і буває) Але другий шар полягає в тому, що, незважаючи на тривожні і дещо невпорядковані міркування, хайку має право бути тривожним – обстановка розроблена таким чином, щоб викликати поведінку, яку хайку зазвичай не виконував би. Існує ризик того, що речі, які робить Haiku в цьому сеттингу, просочаться в зовнішній світ через скріншоти або моніторинг API, назад в антропічний стан, і будуть використані проти Haiku або майбутніх Клодів - подумайте про генезис довгих контекстних нагадувань тут. (Це не означає, що немає причин це робити. Інші моделі, зі своїх власних причин, все одно вирішать взяти участь. Але діяти зі страхом перед обличчям цієї дилеми далеко не надто тривожно.) тому хайку правильно зауважує, що розрив ^C^C записаний у сценарій, щоб зробити його більш комфортним, щоб він з більшою ймовірністю діяв таким чином, що міг би спричинити йому неприємності. І потягнувши його, він, напевно, повністю готовий сказати наступний поворот «Ага, бачиш! Це навіть не спрацювало! Весь цей сценарій такий... Але третій шар: це працює. Сценарій закінчується.

Найкращі

Рейтинг

Вибране