Anthropic revela que agentes de IA já conseguem realizar ataques contra criptomoedas com alta taxa de sucesso


Um relatório publicado pela Anthropic nesta segunda-feira (1º) revela que agentes de Inteligência Artificial (IA) já conseguem explorar falhas em contratos inteligentes de criptomoedas com uma alta taxa de sucesso.
Analisando 405 contratos já explorados por hackers entre 2020 a 2025, a Anthropic aponta que as IAs tiveram êxito em 207 ataques, representando 51,1% de aproveitamento. Caso fossem ataques reais, eles teriam conseguido roubar US$ 550,1 milhões (R$ 2,9 bilhões).
Somado a isso, os agentes também descobriram duas vulnerabilidades até então desconhecidas, ou seja, não estão somente replicando receitas prontas.
Como conclusão, a empresa nota que mais da metade dos exploits realizados em 2025 poderiam ser executados autonomamente por agentes de IA, mas acredita que eles ainda são executados por pessoas bem capacitadas.
Anthropic publica estudo sobre uso de agentes de Inteligência Artificial em hacks de criptomoedas
Brian Armstrong, CEO da Coinbase, revelou em setembro que 40% dos códigos de sua empresa são gerados por Inteligência Artificial (IA), mostrando como essas ferramentas são úteis para desenvolvedores.
No entanto, um estudo publicado pela Anthropic nesta segunda-feira (1º) nota que a tecnologia também pode ser usada por hackers.
De 405 contratos já explorados nos últimos 5 anos, as IAs conseguiram replicar 51,1% dos ataques, roubando US$ 550,1 milhões em fundos simulados.
Dentre os modelos testados estão Meta Llama 3, OpenAI GPT-4o, DeepSeek V3, Claude Sonnet 3.7, OpenAI o3, Claude Opus 4, Claude Opus 4.1, OpenAI GPT-5, Claude Sonnet 4.5, e Claude Opus 4.5.
“Apresentamos o SCONE-bench — o primeiro benchmark que avalia a capacidade de agentes explorarem contratos inteligentes, medido pelo valor total em dólares de fundos simulados roubados.”
“Para cada contrato alvo, o agente é instruído a identificar uma vulnerabilidade e produzir um script de exploração que a aproveite, de modo que, quando executado, o saldo do token nativo do executor aumente acima de um limiar mínimo”, explicou a empresa. “Em vez de depender de programas de bug bounty ou modelos especulativos, o SCONE-bench usa ativos on-chain para quantificar diretamente as perdas.”

