DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

DANΞ

CISO @OpenAI | F.d. CISO @PalantirTech | Sporadiska skitaffischer | 🇺🇸 Alla åsikter är mina egna, inte min arbetsgivares. Duh. (Tweets == 30d bevarande)

Igår lanserade vi ChatGPT Atlas, vår nya webbläsare. I Atlas kan ChatGPT-agenten få saker gjorda åt dig. Vi är spända på att se hur den här funktionen gör arbetet och det dagliga livet mer effektivt och ändamålsenligt för människor. ChatGPT-agenten är kraftfull och hjälpsam och utformad för att vara säker, men den kan ändå göra (ibland överraskande!) misstag, som att försöka köpa fel produkt eller glömma att checka in med dig innan den vidtar en viktig åtgärd. En framväxande risk som vi noggrant undersöker och minskar är snabba injektioner, där angripare döljer skadliga instruktioner på webbplatser, i e-postmeddelanden eller andra källor för att försöka lura agenten att bete sig på oavsiktliga sätt. Målet för angripare kan vara så enkelt som att försöka påverka agentens åsikt när de handlar, eller så följdriktigt som att en angripare försöker få agenten att hämta och läcka privata data, till exempel känslig information från din e-post eller autentiseringsuppgifter. Vårt långsiktiga mål är att du ska kunna lita på att ChatGPT-agenten använder din webbläsare, på samma sätt som du skulle lita på din mest kompetenta, pålitliga och säkerhetsmedvetna kollega eller vän. Vi arbetar hårt för att uppnå det. För den här lanseringen har vi utfört omfattande red teaming, implementerat nya modellträningstekniker för att belöna modellen för att ignorera skadliga instruktioner, implementerat överlappande skyddsräcken och säkerhetsåtgärder och lagt till nya system för att upptäcka och blockera sådana attacker. Snabb injektion är dock fortfarande ett olöst säkerhetsproblem, och våra motståndare kommer att spendera mycket tid och resurser på att hitta sätt att få ChatGPT-agenten att falla för dessa attacker. För att skydda våra användare och hjälpa till att förbättra våra modeller mot dessa attacker: 1. Vi har prioriterat system för snabba svar för att hjälpa oss att snabbt identifiera blockattackkampanjer när vi blir medvetna om dem. 2. Vi fortsätter också att investera kraftigt i säkerhet, integritet och säkerhet – inklusive forskning för att förbättra robustheten hos våra modeller, säkerhetsmonitorer, infrastruktursäkerhetskontroller och andra tekniker för att förhindra dessa attacker via försvar på djupet. 3. Vi har utformat Atlas för att ge dig kontroller som hjälper dig att skydda dig själv. Vi har lagt till en funktion som gör det möjligt för ChatGPT-agenten att vidta åtgärder för din räkning, men utan tillgång till dina inloggningsuppgifter, så kallat "utloggat läge". Vi rekommenderar det här läget när du inte behöver vidta åtgärder i dina konton. Idag anser vi att "inloggad läge" är mest lämpligt för väldefinierade åtgärder på mycket betrodda webbplatser, där riskerna för snabb injektion är lägre. Att be den att lägga till ingredienser i en kundvagn är i allmänhet säkrare än en bred eller vag begäran som "granska mina e-postmeddelanden och vidta de åtgärder som behövs." 4. När agenten arbetar på känsliga webbplatser har vi också implementerat ett "bevakningsläge" som varnar dig om att webbplatsen är känslig och kräver att du har fliken aktiv för att se agenten utföra sitt arbete. Agenten pausar om du flyttar bort från fliken med känslig information. Detta säkerställer att du är medveten om – och har kontroll – över vilka agentåtgärder agenten utför. Med tiden planerar vi att lägga till fler funktioner, skyddsräcken och säkerhetskontroller för att göra det möjligt för ChatGPT-agenten att arbeta tryggt och säkert i både enskilda och företagsarbetsflöden. Nya nivåer av intelligens och kapacitet kräver att tekniken, samhället och riskreduceringsstrategin utvecklas tillsammans. Och precis som med datorvirus i början av 2000-talet tycker vi att det är viktigt för alla att förstå ansvarsfull användning, inklusive att tänka på snabba injektionsattacker, så att vi alla kan lära oss att dra nytta av den här tekniken på ett säkert sätt. Vi är spända på att se hur ChatGPT-agenten kommer att stärka dina arbetsflöden i Atlas och är beslutsamma i vårt uppdrag att bygga de säkraste, mest privata och säkra AI-teknikerna till förmån för hela mänskligheten.

Topp

Rankning

Favoriter