Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

DANΞ

@OpenAI CISO | Były dyrektor ds. bezpieczeństwa informacji @PalantirTech | Okazjonalny | 🇺🇸 Wszystkie poglądy są moje, a nie mojego pracodawcy. Nie. (Tweety == Retencja 30d)

Wczoraj uruchomiliśmy ChatGPT Atlas, naszą nową przeglądarkę internetową. W Atlasie agent ChatGPT może załatwiać sprawy za Ciebie. Jesteśmy podekscytowani, jak ta funkcja uczyni pracę i codzienne życie bardziej efektywnym i skutecznym dla ludzi. Agent ChatGPT jest potężny i pomocny, zaprojektowany z myślą o bezpieczeństwie, ale wciąż może popełniać (czasami zaskakujące!) błędy, takie jak próba zakupu niewłaściwego produktu lub zapomnienie o skontaktowaniu się z Tobą przed podjęciem ważnej decyzji. Jednym z pojawiających się ryzyk, które bardzo starannie badamy i łagodzimy, są wstrzyknięcia poleceń, gdzie napastnicy ukrywają złośliwe instrukcje w witrynach internetowych, e-mailach lub innych źródłach, aby spróbować oszukać agenta, by działał w niezamierzony sposób. Celem napastników może być tak proste, jak próba wpłynięcia na opinię agenta podczas zakupów, lub tak poważne, jak próba skłonienia agenta do pozyskania i ujawnienia prywatnych danych, takich jak wrażliwe informacje z Twojego e-maila lub dane logowania. Naszym długoterminowym celem jest to, abyś mógł ufać agentowi ChatGPT w korzystaniu z przeglądarki, tak jak ufałbyś swojemu najbardziej kompetentnemu, godnemu zaufania i świadomemu bezpieczeństwa koledze lub przyjacielowi. Pracujemy ciężko, aby to osiągnąć. Przy tym uruchomieniu przeprowadziliśmy szerokie testy red-teamowe, wdrożyliśmy nowe techniki szkolenia modeli, aby nagradzać model za ignorowanie złośliwych instrukcji, wprowadziliśmy nakładki zabezpieczające i środki bezpieczeństwa oraz dodaliśmy nowe systemy do wykrywania i blokowania takich ataków. Jednak wstrzyknięcie poleceń pozostaje nieodkrytym problemem bezpieczeństwa, a nasi przeciwnicy będą poświęcać znaczną ilość czasu i zasobów, aby znaleźć sposoby na oszukanie agenta ChatGPT. Aby chronić naszych użytkowników i pomóc w poprawie naszych modeli przeciwko tym atakom: 1. Priorytetowo traktujemy systemy szybkiej reakcji, aby pomóc nam szybko identyfikować kampanie ataków, gdy tylko się o nich dowiemy. 2. Kontynuujemy również intensywne inwestycje w bezpieczeństwo, prywatność i bezpieczeństwo - w tym badania mające na celu poprawę odporności naszych modeli, monitorów bezpieczeństwa, kontroli bezpieczeństwa infrastruktury i innych technik, które pomogą zapobiegać tym atakom poprzez obronę w głębokości. 3. Zaprojektowaliśmy Atlas, aby dać Ci kontrolę, która pomoże Ci się chronić. Dodaliśmy funkcję, która pozwala agentowi ChatGPT podejmować działania w Twoim imieniu, ale bez dostępu do Twoich danych logowania, nazwaną „trybem wylogowanym”. Zalecamy ten tryb, gdy nie musisz podejmować działań w swoich kontach. Dziś uważamy, że „tryb zalogowany” jest najbardziej odpowiedni do dobrze określonych działań na bardzo zaufanych stronach, gdzie ryzyko wstrzyknięcia poleceń jest niższe. Prośba o dodanie składników do koszyka zakupowego jest zazwyczaj bezpieczniejsza niż szerokie lub niejasne żądanie, takie jak „przejrzyj moje e-maile i podejmij wszelkie potrzebne działania”. 4. Gdy agent działa na wrażliwych stronach, wdrożyliśmy również „Tryb obserwacji”, który informuje Cię o wrażliwym charakterze strony i wymaga, abyś miał aktywną kartę, aby obserwować, jak agent wykonuje swoją pracę. Agent wstrzyma się, jeśli odejdziesz od karty z wrażliwymi informacjami. To zapewnia, że pozostajesz świadomy - i masz kontrolę - nad tym, jakie działania podejmuje agent. Z biegiem czasu planujemy dodać więcej funkcji, nakładek zabezpieczających i środków bezpieczeństwa, aby umożliwić agentowi ChatGPT pracę w sposób bezpieczny i zabezpieczony zarówno w indywidualnych, jak i przedsiębiorczych przepływach pracy. Nowe poziomy inteligencji i zdolności wymagają, aby technologia, społeczeństwo i strategia łagodzenia ryzyka ewoluowały razem. I tak jak w przypadku wirusów komputerowych na początku lat 2000, uważamy, że ważne jest, aby wszyscy rozumieli odpowiedzialne użytkowanie, w tym myślenie o atakach wstrzyknięcia poleceń, abyśmy wszyscy mogli nauczyć się korzystać z tej technologii w sposób bezpieczny. Jesteśmy podekscytowani, jak agent ChatGPT wzmocni Twoje przepływy pracy w Atlasie i jesteśmy zdeterminowani w naszej misji, aby zbudować najbezpieczniejsze, najbardziej prywatne i bezpieczne technologie AI dla dobra całej ludzkości.

Najlepsze

Ranking

Ulubione