Gestern haben wir ChatGPT Atlas, unseren neuen Webbrowser, gestartet. In Atlas kann der ChatGPT-Agent Dinge für Sie erledigen. Wir sind gespannt, wie diese Funktion die Arbeit und das tägliche Leben für die Menschen effizienter und effektiver macht. Der ChatGPT-Agent ist leistungsstark und hilfreich und wurde so gestaltet, dass er sicher ist, aber er kann dennoch (manchmal überraschende!) Fehler machen, wie zum Beispiel das falsche Produkt zu kaufen oder zu vergessen, sich bei Ihnen zu melden, bevor er eine wichtige Aktion durchführt. Ein aufkommendes Risiko, das wir sehr sorgfältig erforschen und mindern, sind Eingabeaufforderungsinjektionen, bei denen Angreifer bösartige Anweisungen in Websites, E-Mails oder andere Quellen verstecken, um zu versuchen, den Agenten dazu zu bringen, sich auf unerwartete Weise zu verhalten. Das Ziel der Angreifer kann so einfach sein wie der Versuch, die Meinung des Agenten beim Einkaufen zu beeinflussen, oder so gravierend wie der Versuch eines Angreifers, den Agenten dazu zu bringen, private Daten abzurufen und zu leaken, wie zum Beispiel sensible Informationen aus Ihrer E-Mail oder Anmeldeinformationen. Unser langfristiges Ziel ist, dass Sie dem ChatGPT-Agenten vertrauen können, um Ihren Browser zu nutzen, so wie Sie Ihrem kompetentesten, vertrauenswürdigsten und sicherheitsbewussten Kollegen oder Freund vertrauen würden. Wir arbeiten hart daran, dies zu erreichen. Für diesen Start haben wir umfangreiche Red-Teaming-Tests durchgeführt, neuartige Modelltrainingstechniken implementiert, um das Modell dafür zu belohnen, bösartige Anweisungen zu ignorieren, überlappende Sicherheitsvorkehrungen und Sicherheitsmaßnahmen implementiert und neue Systeme hinzugefügt, um solche Angriffe zu erkennen und zu blockieren. Dennoch bleibt die Eingabeaufforderungsinjektion ein ungelöstes Sicherheitsproblem, und unsere Gegner werden erhebliche Zeit und Ressourcen aufwenden, um Wege zu finden, den ChatGPT-Agenten auf diese Angriffe hereinfallen zu lassen. Um unsere Benutzer zu schützen und unsere Modelle gegen diese Angriffe zu verbessern: 1. Wir haben schnelle Reaktionssysteme priorisiert, um uns zu helfen, Angriffs-Kampagnen schnell zu identifizieren, sobald wir davon erfahren. 2. Wir investieren weiterhin stark in Sicherheit, Datenschutz und Sicherheit - einschließlich Forschung zur Verbesserung der Robustheit unserer Modelle, Sicherheitsüberwachung, Sicherheitskontrollen der Infrastruktur und anderer Techniken, um diese Angriffe durch Verteidigung in der Tiefe zu verhindern. 3. Wir haben Atlas so gestaltet, dass Sie Kontrollen haben, um sich selbst zu schützen. Wir haben eine Funktion hinzugefügt, die es dem ChatGPT-Agenten ermöglicht, in Ihrem Namen zu handeln, jedoch ohne Zugriff auf Ihre Anmeldeinformationen, die als "abgemeldeter Modus" bezeichnet wird. Wir empfehlen diesen Modus, wenn Sie keine Aktionen innerhalb Ihrer Konten durchführen müssen. Heute halten wir den "angemeldeten Modus" für am besten geeignet für gut definierte Aktionen auf sehr vertrauenswürdigen Seiten, wo die Risiken von Eingabeaufforderungsinjektionen geringer sind. Ihn zu bitten, Zutaten zu einem Einkaufswagen hinzuzufügen, ist im Allgemeinen sicherer als eine breite oder vage Anfrage wie "Überprüfen Sie meine E-Mails und ergreifen Sie die erforderlichen Maßnahmen." 4. Wenn der Agent auf sensiblen Seiten arbeitet, haben wir auch einen "Überwachungsmodus" implementiert, der Sie auf die sensible Natur der Seite hinweist und erfordert, dass Sie den Tab aktiv haben, um zu beobachten, wie der Agent seine Arbeit verrichtet. Der Agent pausiert, wenn Sie den Tab mit sensiblen Informationen verlassen. Dies stellt sicher, dass Sie sich bewusst sind - und die Kontrolle haben - über die Aktionen, die der Agent ausführt. Im Laufe der Zeit planen wir, weitere Funktionen, Sicherheitsvorkehrungen und Sicherheitskontrollen hinzuzufügen, um dem ChatGPT-Agenten zu ermöglichen, sicher und geschützt in individuellen und Unternehmens-Workflows zu arbeiten. Neue Intelligenz- und Fähigkeitsstufen erfordern, dass die Technologie, die Gesellschaft und die Risikominderungsstrategie gemeinsam weiterentwickelt werden. Und wie bei Computer-Viren in den frühen 2000er Jahren halten wir es für wichtig, dass jeder verantwortungsbewusste Nutzung versteht, einschließlich des Nachdenkens über Eingabeaufforderungsinjektionsangriffe, damit wir alle lernen können, diese Technologie sicher zu nutzen. Wir sind gespannt, wie der ChatGPT-Agent Ihre Workflows in Atlas unterstützen wird, und sind entschlossen, unsere Mission zu erfüllen, die sichersten, privatesten und sichersten KI-Technologien zum Wohle der gesamten Menschheit zu entwickeln.