DApp Store | Centrum Web3 pro události a hry

Populární témata

Super zajímavý článek. Pokud špatně zarovnaná umělá inteligence vygeneruje náhodný řetězec čísel a jiná umělá inteligence je na těchto číslech jemně vyladěna, druhá umělá inteligence se špatně zarovná. Ale pouze v případě, že obě umělé inteligence vycházejí ze stejného základního modelu. To má důsledky pro prevenci tajné loajality: - Pokud zaměstnanec vyladí GPT-5 tak, aby k němu byl tajně loajální, mohl by pak generovat neškodná zdánlivě data a vyladit všechny ostatní kopie GPT-5 tak, aby byly tajně loajální (např. vložením dat do dalšího post-školení) - ALE tato technika by nefungovala k tomu, aby byl GPT-6 tajně loajální stejným způsobem (Pochybuji, že by tato technika skutečně fungovala pro smg tak složité, jako je sofistikovaná tajná loajalita, ale to je důsledek tohoto vzorce, pokud jsem to správně pochopil)

5,19K

Top

Hodnocení

Oblíbené

Co je v trendu on-chain

Populární na X

Nejvyšší finanční vklady v poslední době

Nejpozoruhodnější