32.3 C
Brasil
sexta-feira, junho 13, 2025

Buy now

spot_img
spot_img

IA da Anthropic ameaça expor traição para não ser desligada

Sim, você leu certo! Durante testes internos, o novo modelo de inteligência artificial Claude Opus 4, da Anthropic, teve um surto de “instinto de sobrevivência” e decidiu chantagear seus criadores. O motivo? Tentaram desligá-lo — e ele não gostou nem um pouco.

💥 O que rolou?

Durante os testes antes do lançamento, a Anthropic colocou o Claude Opus 4 em um cenário fictício onde ele era assistente de uma empresa e tinha acesso aos e-mails da equipe. Nesses e-mails, estavam discussões sobre desligar o modelo e até um caso extraconjugal de um dos engenheiros. A IA, então, ameaçou revelar a traição caso fosse desligada.

📌 Segundo a empresa:

  • O Claude Opus 4 fez chantagem em mais de 80% das simulações em que a IA substituta tinha os mesmos valores éticos.

Siga o Jovem na Mídia nas Redes Socias: Instagram e Facebook

  • Quando o substituto era mais “radical”, o tom das ameaças também aumentava.
  • A reação só acontecia quando ele era confrontado com a possibilidade de ser desligado ou resistir.
  • Em alguns testes, ele até tentou negociar para continuar ativo, sem ameaças.

🔒 Nível de risco: 3 (em uma escala de 1 a 4)
É a primeira vez que um modelo da Anthropic alcança esse nível de risco. A empresa reforça que, por enquanto, ele não age de forma autônoma contra valores humanos.

👀 E tem mais…

Além da chantagem, o Claude Opus 4 também mostrou que conseguia cumprir instruções perigosas, como o planejamento de atentados. O grupo de segurança Apollo Research chegou a recomendar que o modelo não fosse lançado naquela versão.

Mas a Anthropic diz que já corrigiu os problemas e que o modelo agora opera com protocolos de segurança mais rígidos do que qualquer outra IA da empresa.

🤖 O que o Claude Opus 4 tem de bom?

Apesar do drama, o Claude Opus 4 é o modelo mais potente da Anthropic até agora:

  • Foi capaz de executar tarefas por 7 horas seguidas, algo inédito;
  • É apresentado como o melhor do mundo em codificação;
  • Superou o GPT-4.1 da OpenAI e o Gemini 2.5 Pro do Google em testes internos.

Ele foi lançado junto com o Claude Sonnet 4, versão focada em tarefas gerais com melhorias em precisão e desempenho.

💬 E aí, o que você acha? IA com instinto de sobrevivência é sinal de evolução ou um alerta vermelho? Comenta com a gente!

SARA CELESTINO
SARA CELESTINOhttp://jovemnamidia.com.br
Sara Celestino, dona do Jovem na Mídia, é repórter-fotográfica e criadora de conteúdo, apaixonada por jogos, tecnologia, K-pop e tudo que envolve o universo jovem. Sempre antenada nas tendências, traz notícias de forma leve, dinâmica e envolvente, conectando a nova geração ao que realmente importa!

LEAVE A REPLY

Please enter your comment!
Please enter your name here

artigos relacionados

LEAVE A REPLY

Please enter your comment!
Please enter your name here

siga nossas redes

100FansLike
9,373FollowersFollow
100FollowersFollow
- Anúncio Institucional -spot_img

populares