DApp Store | Web3 Hub for hendelser og spill

Populære emner

DANΞ

CISO-@OpenAI | Eks-CISO-@PalantirTech | Sporadisk drittplakat | 🇺🇸 Alle synspunkter er mine egne, ikke min arbeidsgiver. Duh. (Tweets == 30d oppbevaring)

I går lanserte vi ChatGPT Atlas, vår nye nettleser. I Atlas kan ChatGPT-agenten få ting gjort for deg. Vi er glade for å se hvordan denne funksjonen gjør arbeid og hverdag mer effektivt for folk. ChatGPT-agenten er kraftig og nyttig, og designet for å være trygg, men den kan fortsatt gjøre (noen ganger overraskende!) feil, som å prøve å kjøpe feil produkt eller glemme å sjekke inn med deg før du tar en viktig handling. En ny risiko som vi undersøker og reduserer nøye er raske injeksjoner, der angripere skjuler ondsinnede instruksjoner på nettsteder, e-poster eller andre kilder, for å prøve å lure agenten til å oppføre seg på utilsiktede måter. Målet for angripere kan være så enkelt som å prøve å påvirke agentens mening mens de handler, eller så konsekvensfullt som en angriper som prøver å få agenten til å hente og lekke private data, for eksempel sensitiv informasjon fra e-posten din eller legitimasjon. Vårt langsiktige mål er at du skal kunne stole på at ChatGPT-agenten bruker nettleseren din, på samme måte som du vil stole på din mest kompetente, pålitelige og sikkerhetsbevisste kollega eller venn. Vi jobber hardt for å oppnå det. For denne lanseringen har vi utført omfattende red-teaming, implementert nye modelltreningsteknikker for å belønne modellen for å ignorere ondsinnede instruksjoner, implementert overlappende rekkverk og sikkerhetstiltak, og lagt til nye systemer for å oppdage og blokkere slike angrep. Imidlertid er rask injeksjon fortsatt et grenseløst, uløst sikkerhetsproblem, og våre motstandere vil bruke betydelig tid og ressurser på å finne måter å få ChatGPT-agenten til å falle for disse angrepene. For å beskytte brukerne våre, og for å bidra til å forbedre modellene våre mot disse angrepene: 1. Vi har prioritert hurtigresponssystemer for å hjelpe oss med å raskt identifisere blokkeringsangrepskampanjer etter hvert som vi blir oppmerksomme på dem. 2. Vi fortsetter også å investere tungt i sikkerhet, personvern og sikkerhet – inkludert forskning for å forbedre robustheten til modellene våre, sikkerhetsmonitorer, sikkerhetskontroller for infrastruktur og andre teknikker for å forhindre disse angrepene via forsvar i dybden. 3. Vi har utformet Atlas for å gi deg kontroller for å beskytte deg selv. Vi har lagt til en funksjon som lar ChatGPT-agenten iverksette tiltak på dine vegne, men uten tilgang til legitimasjonen din kalt "logget ut modus". Vi anbefaler denne modusen når du ikke trenger å gjøre noe i kontoene dine. I dag mener vi at «pålogget modus» er mest hensiktsmessig for veldefinerte handlinger på svært pålitelige nettsteder, der risikoen for rask injeksjon er lavere. Å be den om å legge ingredienser i en handlekurv er generelt tryggere enn en bred eller vag forespørsel som "gjennomgå e-postene mine og ta de nødvendige handlingene." 4. Når agenten opererer på sensitive nettsteder, har vi også implementert en "Overvåkningsmodus" som varsler deg om nettstedets sensitive natur og krever at du har fanen aktiv for å se agenten gjøre jobben sin. Agenten stopper midlertidig hvis du beveger deg bort fra fanen med sensitiv informasjon. Dette sikrer at du holder deg klar over – og har kontroll – over hvilke agenthandlinger agenten utfører. Over tid planlegger vi å legge til flere funksjoner, rekkverk og sikkerhetskontroller for å gjøre det mulig for ChatGPT-agenten å jobbe trygt og sikkert på tvers av både individuelle og bedriftsarbeidsflyter. Nye nivåer av intelligens og kapasitet krever at teknologien, samfunnet og risikoreduserende strategi utvikler seg sammen. Og som med datavirus på begynnelsen av 2000-tallet, tror vi det er viktig for alle å forstå ansvarlig bruk, inkludert å tenke på raske injeksjonsangrep, slik at vi alle kan lære å dra nytte av denne teknologien trygt. Vi er spente på å se hvordan ChatGPT-agenten vil styrke arbeidsflytene dine i Atlas, og er resolutte i vårt oppdrag om å bygge de sikreste, mest private og trygge AI-teknologiene til fordel for hele menneskeheten.

Topp

Rangering

Favoritter