DApp Store | Web3 Hub tapahtumille ja peleille

Trendaavat aiheet

prinz

Älä pelkää suuruutta

Julian Schrittwieser (antropinen): - Keskustelu tekoälykuplasta X:ssä on "hyvin kaukana" siitä, mitä tapahtuu rajalaboratorioissa. "Eturintaman laboratorioissa emme näe edistymisen hidastumista." - Tekoälyllä on "valtava taloudellinen vaikutus". OpenAI:n, Anthropicin ja Googlen tuloennusteet ovat itse asiassa "melko konservatiivisia". - Ekstrapoloimalla esimerkiksi METR-tiedoista mallit pystyvät ensi vuonna työskentelemään itsenäisesti monenlaisissa tehtävissä. Tehtävän pituus on tärkeä, koska se avaa ihmisen kyvyn valvoa malliryhmää, joista jokainen työskentelee itsenäisesti tuntikausia kerrallaan (verrattuna siihen, että hänen pitäisi puhua agentin kanssa 10 minuutin välein antaakseen sille palautetta). - "Erittäin todennäköistä", että nykyinen lähestymistapa tekoälymallien kouluttamiseen (esikoulutus, RL) tuottaa järjestelmän, joka pystyy suoriutumaan suunnilleen ihmisen tasolla periaatteessa kaikissa tuottavuuden kannalta tärkeissä tehtävissä. - Liikkeestä 37: "Mielestäni on melko selvää, että nämä mallit voivat tehdä uusia asioita." AlphaCode ja AlphaTensor "osoittivat, että voit löytää uusia ohjelmia ja algoritmeja". Tekoäly "löytää jo ehdottomasti uusia asioita", ja "olemme vain siirtymässä ylöspäin asteikolla sen suhteen, kuinka vaikuttavia ja mielenkiintoisia ovat ne asiat, jotka se pystyy löytämään itse". - "Erittäin todennäköistä", että joskus ensi vuonna saamme löytöjä, jotka ihmiset ovat yksimielisesti yhtä mieltä erittäin vaikuttavista. - Tekoäly pystyy yksinään tekemään Nobel-palkinnon arvoisen läpimurron vuonna 2027 tai 2028. - Tekoälyn kyvystä nopeuttaa tekoälyn kehitystä: Hyvin yleinen ongelma monilla tieteenaloilla on, että edistyminen alan edetessä on yhä vaikeampaa (eli 100 vuotta sitten yksi tiedemies saattoi löytää ensimmäisen antibiootin vahingossa, kun taas nyt uuden lääkkeen löytäminen vaatii miljardeja dollareita). Sama voi tapahtua tekoälytutkimuksessa - vaikka tekoäly tekee uuden tekoälyn tutkimuksesta tuottavampaa, räjähdysmäistä ei välttämättä tapahdu, koska uusia edistysaskeleita on yhä vaikeampi löytää.

OpenAI CISO:n lausunto re: nopean injektion riskien vähentäminen Atlaksessa

Eilen julkaisimme ChatGPT Atlasin, uuden verkkoselaimemme. Atlaksessa ChatGPT-agentti voi tehdä asioita puolestasi. Odotamme innolla, miten tämä ominaisuus tekee työstä ja jokapäiväisestä elämästä tehokkaampaa ja vaikuttavampaa ihmisille. ChatGPT-agentti on tehokas ja avulias, ja se on suunniteltu turvalliseksi, mutta se voi silti tehdä (joskus yllättäviä!) virheitä, kuten yrittää ostaa väärän tuotteen tai unohtaa kirjautua sisään ennen tärkeän toimenpiteen tekemistä. Yksi nouseva riski, jota tutkimme ja lievennämme erittäin harkiten, ovat nopeat injektiot, joissa hyökkääjät piilottavat haitallisia ohjeita verkkosivustoille, sähköposteihin tai muihin lähteisiin yrittääkseen huijata agentin käyttäytymään tahattomasti. Hyökkääjien tavoite voi olla niinkin yksinkertainen kuin agentin mielipiteen vääristäminen ostosten aikana tai niinkin merkittävä kuin hyökkääjä, joka yrittää saada agentin hakemaan ja vuotamaan yksityisiä tietoja, kuten arkaluonteisia tietoja sähköpostistasi tai tunnistetietojasi. Pitkän aikavälin tavoitteenamme on, että voit luottaa ChatGPT-agenttiin selaimesi käytössä samalla tavalla kuin luottaisit pätevimpään, luotettavimpaan ja tietoturvatietoisimpaan kollegaasi tai ystävääsi. Teemme kovasti töitä saavuttaaksemme sen. Tätä julkaisua varten olemme suorittaneet laajan red-teamingin, ottaneet käyttöön uusia mallikoulutustekniikoita palkitaksemme mallia haitallisten ohjeiden huomiotta jättämisestä, ottaneet käyttöön päällekkäisiä suojakaiteitä ja turvatoimenpiteitä sekä lisänneet uusia järjestelmiä tällaisten hyökkäysten havaitsemiseksi ja estämiseksi. Nopea injektio on kuitenkin edelleen ratkaisematon tietoturvaongelma, ja vastustajamme käyttävät paljon aikaa ja resursseja löytääkseen tapoja saada ChatGPT-agentti lankeamaan näihin hyökkäyksiin. Suojellaksemme käyttäjiämme ja auttaaksemme parantamaan mallejamme näitä hyökkäyksiä vastaan: 1. Olemme priorisoineet nopean toiminnan järjestelmät, joiden avulla voimme nopeasti tunnistaa lohkohyökkäyskampanjat, kun saamme niistä tietoomme. 2. Jatkamme myös vahvoja investointeja turvallisuuteen, yksityisyyteen ja turvallisuuteen – mukaan lukien tutkimus mallidemme, tietoturvavalvojiemme, infrastruktuurin turvakontrolliemme ja muiden tekniikoidemme kestävyyden parantamiseksi, jotka auttavat estämään näitä hyökkäyksiä syvällisen puolustuksen avulla. 3. Olemme suunnitelleet Atlaksen niin, että voit suojautua itseltäsi. Olemme lisänneet ominaisuuden, jonka avulla ChatGPT-agentti voi toimia puolestasi, mutta ilman pääsyä kirjautumistietoihisi, nimeltään "uloskirjautunut tila". Suosittelemme tätä tilaa, kun sinun ei tarvitse tehdä mitään tileilläsi. Nykyään uskomme, että "sisäänkirjautumistila" sopii parhaiten hyvin rajattuihin toimiin erittäin luotettavilla sivustoilla, joissa nopean injektion riski on pienempi. Sen pyytäminen lisäämään ainesosia ostoskoriin on yleensä turvallisempaa kuin laaja tai epämääräinen pyyntö, kuten "tarkista sähköpostini ja ryhdy tarvittaviin toimiin". 4. Kun agentti toimii arkaluonteisilla sivustoilla, olemme myös ottaneet käyttöön "Watch Mode" -tilan, joka varoittaa sinua sivuston arkaluonteisesta luonteesta ja edellyttää, että sinulla on aktiivinen välilehti, jotta voit seurata agentin työtä. Agentti keskeyttää, jos siirryt pois välilehdeltä, jossa on arkaluonteisia tietoja. Näin varmistat, että pysyt tietoisena - ja hallitset - agentin toimia. Ajan myötä aiomme lisätä lisää ominaisuuksia, suojakaiteita ja turvatoimintoja, jotta ChatGPT-agentti voi työskennellä turvallisesti sekä yksittäisissä että yritystyönkuluissa. Älykkyyden ja kyvykkyyden uudet tasot edellyttävät teknologian, yhteiskunnan ja riskinhallintastrategian kehittymistä yhdessä. Ja kuten tietokonevirusten kohdalla 2000-luvun alussa, mielestämme on tärkeää, että kaikki ymmärtävät vastuullisen käytön, mukaan lukien nopeat injektiohyökkäykset, jotta voimme kaikki oppia hyötymään tästä tekniikasta turvallisesti. Olemme innoissamme nähdessämme, kuinka ChatGPT-agentti tehostaa työnkulkujasi Atlaksessa, ja olemme päättäväisiä tehtävässämme rakentaa turvallisimpia, yksityisimpiä ja turvallisimpia tekoälyteknologioita koko ihmiskunnan hyödyksi.

Johtavat

Rankkaus

Suosikit