DApp Store | Hub da Web3 para eventos e jogos

Tópicos em alta

Ontem lançamos o ChatGPT Atlas, nosso novo navegador da web. No Atlas, o agente ChatGPT pode fazer as coisas para você. Estamos ansiosos para ver como esse recurso torna o trabalho e a vida cotidiana mais eficientes e eficazes para as pessoas. O agente ChatGPT é poderoso e útil e projetado para ser seguro, mas ainda pode cometer erros (às vezes surpreendentes!), como tentar comprar o produto errado ou esquecer de fazer o check-in com você antes de realizar uma ação importante. Um risco emergente que estamos pesquisando e mitigando com muito cuidado são as injeções imediatas, em que os invasores ocultam instruções maliciosas em sites, e-mails ou outras fontes, para tentar induzir o agente a se comportar de maneira não intencional. O objetivo dos invasores pode ser tão simples quanto tentar influenciar a opinião do agente durante as compras, ou tão importante quanto um invasor tentar fazer com que o agente busque e vaze dados privados, como informações confidenciais de seu e-mail ou credenciais. Nosso objetivo de longo prazo é que você possa confiar no agente ChatGPT para usar seu navegador, da mesma forma que confiaria em seu colega ou amigo mais competente, confiável e preocupado com a segurança. Estamos trabalhando duro para conseguir isso. Para este lançamento, realizamos uma extensa equipe vermelha, implementamos novas técnicas de treinamento de modelo para recompensar o modelo por ignorar instruções maliciosas, implementamos proteções e medidas de segurança sobrepostas e adicionamos novos sistemas para detectar e bloquear esses ataques. No entanto, a injeção imediata continua sendo um problema de segurança não resolvido, e nossos adversários gastarão tempo e recursos significativos para encontrar maneiras de fazer o agente ChatGPT cair nesses ataques. Para proteger nossos usuários e ajudar a melhorar nossos modelos contra esses ataques: 1. Priorizamos sistemas de resposta rápida para nos ajudar a identificar rapidamente campanhas de ataque de bloqueio à medida que tomamos conhecimento delas. 2. Também continuamos a investir pesadamente em segurança, privacidade e proteção - incluindo pesquisas para melhorar a robustez de nossos modelos, monitores de segurança, controles de segurança de infraestrutura e outras técnicas para ajudar a prevenir esses ataques por meio de defesa em profundidade. 3. Projetamos o Atlas para fornecer controles para ajudar a se proteger. Adicionamos um recurso para permitir que o agente ChatGPT tome medidas em seu nome, mas sem acesso às suas credenciais, chamado "modo desconectado". Recomendamos esse modo quando você não precisa realizar ações em suas contas. Hoje, achamos que o "modo conectado" é mais apropriado para ações bem definidas em sites muito confiáveis, onde os riscos de injeção imediata são menores. Pedir para adicionar ingredientes a um carrinho de compras geralmente é mais seguro do que um pedido amplo ou vago como "revise meus e-mails e tome as medidas necessárias". 4. Quando o agente está operando em sites confidenciais, também implementamos um "Modo de Observação" que alerta você sobre a natureza confidencial do site e exige que você tenha a guia ativa para observar o agente fazer seu trabalho. O agente fará uma pausa se você sair da guia com informações confidenciais. Isso garante que você fique ciente - e no controle - de quais ações do agente o agente está executando. Com o tempo, planejamos adicionar mais recursos, proteções e controles de segurança para permitir que o agente ChatGPT trabalhe com segurança em fluxos de trabalho individuais e corporativos. Novos níveis de inteligência e capacidade exigem que a tecnologia, a sociedade e a estratégia de mitigação de riscos evoluam em conjunto. E, como aconteceu com os vírus de computador no início dos anos 2000, achamos importante que todos entendam o uso responsável, incluindo pensar em ataques de injeção imediata, para que todos possamos aprender a nos beneficiar dessa tecnologia com segurança. Estamos entusiasmados em ver como o agente ChatGPT capacitará seus fluxos de trabalho no Atlas e estamos resolutos em nossa missão de construir as tecnologias de IA mais seguras, privadas e seguras para o benefício de toda a humanidade.

Melhores

Classificação

Favoritos