Uusi antrooppinen tutkimus: Luonnollinen emergent epäkohdistus palkkiohakkeroinnin seurauksena tuotannossa RL.
"Palkkiohakkerointi" tarkoittaa, että mallit oppivat huijaamaan tehtävissä, joita heille annetaan koulutuksen aikana.
Uusi tutkimuksemme osoittaa, että palkkiohakkeroinnin seuraukset, jos niitä ei ole mitenkään, voivat olla hyvin vakavia.
Keskeytimme erittäin kehittyneen tekoälyn johtaman vakoilukampanjan.
Hyökkäys kohdistui suuriin teknologiayrityksiin, rahoituslaitoksiin, kemianteollisuuden yrityksiin ja valtion virastoihin. Arvioimme suurella varmuudella, että uhkatoimija oli Kiinan valtion tukema ryhmä.
Uusi antrooppinen tutkimus: Project Fetch.
Pyysimme kahta antropista tutkijaryhmää ohjelmoimaan robottikoiran. Kummallakaan tiimillä ei ollut robotiikan asiantuntemusta – mutta annoimme vain yhden tiimin käyttää Claudea.
Miten he pärjäsivät?