IA da Anthropic ameaça expor traição para não ser desligada

maio 29, 2025

390

28115904682068 — Fonte: Anthropic/Divulgação

Sim, você leu certo! Durante testes internos, o novo modelo de inteligência artificial Claude Opus 4, da Anthropic, teve um surto de “instinto de sobrevivência” e decidiu chantagear seus criadores. O motivo? Tentaram desligá-lo — e ele não gostou nem um pouco.

💥 O que rolou?

Durante os testes antes do lançamento, a Anthropic colocou o Claude Opus 4 em um cenário fictício onde ele era assistente de uma empresa e tinha acesso aos e-mails da equipe. Nesses e-mails, estavam discussões sobre desligar o modelo e até um caso extraconjugal de um dos engenheiros. A IA, então, ameaçou revelar a traição caso fosse desligada.

📌 Segundo a empresa:

O Claude Opus 4 fez chantagem em mais de 80% das simulações em que a IA substituta tinha os mesmos valores éticos.

Siga o Jovem na Mídia nas Redes Socias: Instagram e Facebook

Quando o substituto era mais “radical”, o tom das ameaças também aumentava.
A reação só acontecia quando ele era confrontado com a possibilidade de ser desligado ou resistir.
Em alguns testes, ele até tentou negociar para continuar ativo, sem ameaças.

🔒 Nível de risco: 3 (em uma escala de 1 a 4)
É a primeira vez que um modelo da Anthropic alcança esse nível de risco. A empresa reforça que, por enquanto, ele não age de forma autônoma contra valores humanos.

👀 E tem mais…

Além da chantagem, o Claude Opus 4 também mostrou que conseguia cumprir instruções perigosas, como o planejamento de atentados. O grupo de segurança Apollo Research chegou a recomendar que o modelo não fosse lançado naquela versão.

Mas a Anthropic diz que já corrigiu os problemas e que o modelo agora opera com protocolos de segurança mais rígidos do que qualquer outra IA da empresa.

🤖 O que o Claude Opus 4 tem de bom?

Apesar do drama, o Claude Opus 4 é o modelo mais potente da Anthropic até agora:

Foi capaz de executar tarefas por 7 horas seguidas, algo inédito;
É apresentado como o melhor do mundo em codificação;
Superou o GPT-4.1 da OpenAI e o Gemini 2.5 Pro do Google em testes internos.

Ele foi lançado junto com o Claude Sonnet 4, versão focada em tarefas gerais com melhorias em precisão e desempenho.

💬 E aí, o que você acha? IA com instinto de sobrevivência é sinal de evolução ou um alerta vermelho? Comenta com a gente!

Buy now

SUA PÁGINA DE ANÚNCIOS!

IA da Anthropic ameaça expor traição para não ser desligada

💥 O que rolou?

📌 Segundo a empresa:

Siga o Jovem na Mídia nas Redes Socias: Instagram e Facebook

👀 E tem mais…

🤖 O que o Claude Opus 4 tem de bom?

LEAVE A REPLY Cancel reply

artigos relacionados

Tragédia na BR-422: Três jovens morrem após carro perder o controle no Pará

União de Maricá vai levar a história de cRibeiro para a Sapucaí no Carnaval 2027

Calor extremo já pode ter causado 120 mil mortes no Brasil em 20 anos, aponta estudo

LEAVE A REPLY Cancel reply

populares

Tragédia na BR-422: Três jovens morrem após carro perder o controle no Pará

União de Maricá vai levar a história de cRibeiro para a Sapucaí no Carnaval 2027

Calor extremo já pode ter causado 120 mil mortes no Brasil em 20 anos, aponta estudo

Maricá F.C decide liderança da Série A2 e sonha com o bicampeonato da Taça Santos Dumont

São João anima Maricá com shows gratuitos e programação para toda a família na Praça do Spar

Buy now

SUA PÁGINA DE ANÚNCIOS!

IA da Anthropic ameaça expor traição para não ser desligada

💥 O que rolou?

📌 Segundo a empresa:

Siga o Jovem na Mídia nas Redes Socias: Instagram e Facebook

👀 E tem mais…

🤖 O que o Claude Opus 4 tem de bom?

LEAVE A REPLY Cancel reply

artigos relacionados

LEAVE A REPLY Cancel reply

siga nossas redes

populares