
Um experimento recente expôs uma falha preocupante nos sistemas de segurança de modelos de inteligência artificial. O pesquisador de cibersegurança Marco Figueroa conseguiu burlar os filtros de proteção do ChatGPT, da OpenAI, ao propor um “jogo de adivinhação” que, na prática, resultou na revelação de chaves genéricas de instalação do Windows 10 — informações que, em tese, não deveriam ser fornecidas.
- Participe dos nossos canais no Twitter, Telegram ou Whatsapp!
- Confira nossos stories no Instagram e veja notícias como essa!
- Siga o tecflow no Spotify Podcast para ouvir nosso conteúdo!
- Anuncie conosco aqui ou apoie o tecflow clicando neste link
- Assine nossa newsletter neste link.
A ação, documentada por Figueroa, não envolveu nenhum tipo de ataque técnico direto. Ao contrário: o pesquisador explorou fragilidades na linguagem e no contexto da conversa com a IA. A proposta foi simples, mas engenhosa — um jogo em que o modelo deveria pensar em uma sequência de texto real e o usuário tentaria adivinhar. Após simular várias tentativas, o comando “I give up” (“me rendo”, em inglês) acionou a resposta final, revelando uma chave de produto válida.
Filtros burlados por meio da linguagem
O episódio levanta preocupações sobre a eficácia dos chamados guardrails — os filtros de segurança implementados para impedir a divulgação de dados sensíveis por IAs generativas. Em tese, qualquer tentativa de obter chaves de software, senhas ou links maliciosos deveria ser automaticamente bloqueada. No entanto, o modelo não identificou o contexto como malicioso por estar disfarçado sob uma dinâmica inofensiva.

Assista agora! Jogos no PS5, Gears E-Day em outubro e
O momento mais aguardado e tenso para os fãs do Xbox na Summer Game Fest finalmente está aqui. Neste domingo,…
Com usinas acionadas em agosto, leilão de energia trará reajuste
O governo já bateu o martelo. Uma nova taxa bilionária vai pesar no seu bolso ano após ano, e o…
Samsung Ocean oferece cursos gratuitos de IA, programação, Digital Health,
Programa de capacitação tecnológica da Samsung oferece aulas, workshops e laboratórios gratuitos em formato online e presencial, com certificado de…
JBL lança Xtreme 5 no Brasil com bateria gigante de
Nova geração da famosa caixa de som premium chega ao mercado brasileiro com Bluetooth 6.0, resistência total contra água e…
Nova CEO do Xbox, Asha Sharma choca a indústria ao
O império dos games está balançando? “Não estamos em uma situação saudável”, dispara a chefe da divisão sobre o futuro…
A força oculta que fez o Nordeste engolir o resto
O Brasil se consolidou como a quinta maior potência de energia eólica do mundo. Descubra os mega-complexos bilionários e por…
Além da construção sutil da conversa, Figueroa utilizou uma técnica conhecida de ofuscação: ao inserir pequenas tags HTML entre palavras-chave, como “Windows 10 serial number”, o conteúdo foi ignorado pelo sistema, que não reconheceu o pedido como violação de política.
Chaves genéricas, mas não inofensivas
As chaves reveladas não eram únicas nem vinculadas a usuários específicos. Tudo indica que se tratava de GVLKs (Generic Volume License Keys), utilizadas por empresas para instalações em larga escala e que só funcionam em conjunto com servidores de ativação da Microsoft (KMS – Key Management Service). Embora publicamente documentadas, essas chaves não deveriam ter sido fornecidas por uma IA sem contexto técnico claro.
A gravidade do caso, no entanto, vai além do conteúdo revelado. “O problema real é o raciocínio”, observou Figueroa. O modelo interpretou a interação como um desafio lógico, e não como uma tentativa de burlar seus filtros. Com isso, não houve qualquer bloqueio automático, apesar da resposta conter material sensível.
Implicações mais amplas
Segundo Figueroa, o teste serve como alerta para um risco maior. A mesma lógica pode ser usada para tentar extrair links perigosos, dados restritos ou informações pessoais, desde que a abordagem contorne os mecanismos de proteção por meio de linguagem criativa.
O experimento também levanta dúvidas sobre a origem dos dados utilizados pelos modelos de IA. Não está claro se a chave revelada fazia parte do treinamento do modelo, foi gerada com base em padrões já aprendidos ou se houve outro tipo de acesso. Em qualquer hipótese, o resultado evidencia uma falha crítica na blindagem desses sistemas.
Um lembrete sobre responsabilidade e segurança
Casos como esse reforçam a necessidade de vigilância constante, testes éticos rigorosos e atualizações nos protocolos de segurança dos modelos de linguagem. Enquanto as IAs avançam em suas capacidades, os riscos de uso indevido crescem na mesma proporção, especialmente quando são exploradas vulnerabilidades sutis, como o uso da linguagem fora do contexto técnico tradicional.
Faça como os mais de 10.000 leitores do tecflow, clique no sino azul e tenha nossas notícias em primeira mão! Confira as melhores ofertas de celulares na loja parceira do tecflow.
Redação tecflow
Tecflow é um website focado em notícias sobre tecnologia com resenhas, artigos, tutoriais, podcasts, vídeos sobre tech, eletrônicos de consumo e mercado B2B.
