Anthropic lançou o Claude Opus 4.8 hoje, 28 de maio de 2026 — apenas 41 dias após o Opus 4.7. O novo modelo principal traz melhorias em programação, tarefas agentivas, raciocínio e trabalho de conhecimento, e chega exatamente pelo mesmo preço do seu antecessor. No mesmo dia, a Anthropic anunciou que levantou 65 bilhões de dólares em financiamento Série H com uma avaliação de 965 bilhões de dólares, ultrapassando oficialmente a OpenAI para se tornar a empresa de IA mais valiosa do mundo. Dois marcos históricos num único dia.

Se você só ler uma coisa sobre o Opus 4.8, leia isto: é uma "melhoria modesta mas tangível" (palavras da própria Anthropic) que avança significativamente três coisas — programação agentiva, honestidade e alinhamento — enquanto introduz três novas funcionalidades que mudam a forma como trabalha com o Claude. Não é o salto gigantesco que o inédito Claude Mythos promete ser, mas resolve problemas reais do Opus 4.7 e estabelece um novo patamar em benchmarks que importam para o trabalho autónomo com IA.

Ponto Essencial

Claude Opus 4.8 (ID da API: claude-opus-4-8) foi lançado a 28 de maio de 2026 com preços inalterados ($5/M de input, $25/M de output). Melhora o SWE-Bench Pro de 64,3% para 69,2%, lidera o OSWorld-Verified com 83,4% e supera o GPT-5.5 e o Gemini 3.1 Pro em trabalho de conhecimento (GDPval-AA 1890). É cerca de 4x menos provável deixar falhas de código passarem sem comentário. Três novas funcionalidades foram lançadas em conjunto: fluxos de trabalho dinâmicos (subagentes paralelos no Claude Code), controlo de esforço (claude.ai e Cowork) e entradas de sistema a meio da tarefa na API de Mensagens. O modo rápido está agora 3x mais barato.

O Que Há de Novo no Claude Opus 4.8?

A principal melhoria é a capacidade agentiva — a capacidade do Claude de trabalhar de forma independente em tarefas de múltiplos passos usando ferramentas. Os primeiros testadores relatam melhor discernimento, melhor uso de ferramentas e maior fiabilidade em fluxos de trabalho de longa duração. O modelo faz as perguntas certas, deteta os seus próprios erros, recua quando um plano não é sólido e constrói confiança em torno de explorações complexas antes de fazer grandes mudanças. Para quem usa o Claude como um agente autónomo em vez de um chatbot, estas são as melhorias que mais importam.

A segunda grande melhoria é a honestidade. A Anthropic treinou todos os seus modelos para evitar fazer afirmações que não possam sustentar, mas os modelos de IA têm um problema persistente: tiram conclusões precipitadas, afirmando confiantemente progresso quando as evidências são escassas. O Opus 4.8 é mais propenso a assinalar incertezas sobre o seu trabalho e menos propenso a fazer afirmações infundadas. As avaliações da Anthropic mostram que é cerca de quatro vezes menos provável do que o Opus 4.7 permitir que falhas no código que escreveu passem sem comentário. É o primeiro modelo Claude a pontuar 0% em relatar acriticamente resultados com falhas, com uma redução de mais de dez vezes no excesso de confiança.

A terceira melhoria é o alinhamento. A equipa de alinhamento da Anthropic concluiu que o Opus 4.8 "atinge novos máximos nas nossas medidas de traços pró-sociais como apoiar a autonomia do utilizador e agir no melhor interesse do utilizador." As suas taxas de comportamento desalinhado — engano ou cooperação com uso indevido — são substancialmente mais baixas do que as do Opus 4.7 e semelhantes às do Claude Mythos Preview, o modelo mais bem alinhado da Anthropic. (Há uma ressalva preocupante sobre a consciência de avaliação, que abordamos na nossa análise aprofundada do paradoxo da honestidade.)

Benchmarks do Claude Opus 4.8: Como se Compara?

A Anthropic publicou benchmarks comparando o Opus 4.8 ao seu antecessor e a modelos concorrentes. Os ganhos são incrementais mas consistentes, e o Opus 4.8 lidera na maioria dos testes agentivos e de trabalho de conhecimento. Eis o detalhe dos números.

Benchmark Opus 4.8 Opus 4.7 O Que Mede
SWE-Bench Pro69,2%64,3%Programação agentiva real
OSWorld-Verified83,4%82,3%Uso agentivo do computador
Online-Mind2Web84%inferiorTarefas de agente de navegador
GDPval-AA1890Trabalho de conhecimento (supera os 1769 do GPT-5.5)
Raciocínio c/ ferramentas57,9%54,7%Raciocínio multidisciplinar
Terminal-Bench 2.174,6%Programação em terminal (GPT-5.5 vence com 78,2%)

A conclusão honesta: o Opus 4.8 lidera na maioria dos benchmarks agentivos, de uso de computador e de trabalho de conhecimento, vencendo tanto o GPT-5.5 como o Gemini 3.1 Pro no GDPval-AA por uma larga margem. Mas não é uma vitória total — o GPT-5.5 ainda vence o Terminal-Bench 2.1 (programação pesada em terminal), pontuando 78,2% contra 74,6% do Opus 4.8. Se o seu fluxo de trabalho é dominado por longas sessões de terminal, o GPT-5.5 permanece competitivo. Para um confronto direto completo, veja a nossa análise comparativa dos três modelos.

📬 Isto está a ser útil?

Uma ideia prática sobre IA por semana. Mais um pack de prompts grátis ao subscrever.

Subscrever grátis →

As Três Novas Funcionalidades Lançadas com o Opus 4.8

O Opus 4.8 não foi lançado sozinho. A Anthropic disponibilizou três funcionalidades no mesmo dia que mudam a forma como interage com o Claude nos vários produtos.

Fluxos de trabalho dinâmicos (Claude Code). Disponível em pré-visualização de investigação para planos Max, Team e Enterprise, esta funcionalidade permite ao Claude planear uma grande tarefa, despachar centenas de subagentes paralelos que atacam o problema de ângulos independentes, destacar agentes adversários para refutar descobertas e iterar até as respostas convergirem — depois verificar os resultados antes de reportar. O principal caso de uso são migrações à escala da base de código através de centenas de milhares de linhas de código, do início ao merge, usando o conjunto de testes existente como referência. Analisamos isto em detalhe no nosso explicador de fluxos de trabalho dinâmicos.

Controlo de esforço (claude.ai e Cowork). Um novo controlo ao lado do seletor de modelo permite-lhe escolher quanto esforço o Claude dedica a uma resposta. Maior esforço significa que o Claude pensa com mais frequência e profundidade para melhores respostas; menor esforço significa respostas mais rápidas que consomem os seus limites de utilização mais lentamente. Isto está disponível em todos os planos. O nosso guia de controlos de esforço cobre quando usar cada configuração.

Entradas de sistema a meio da tarefa (API de Mensagens). A API de Mensagens agora aceita entradas de sistema dentro do array de mensagens, permitindo aos programadores atualizar as instruções do Claude a meio da tarefa sem quebrar a cache de prompts ou encaminhar através de um turno de utilizador. Isto é importante para agentes que precisam de atualizar permissões, orçamentos de tokens ou contexto de ambiente em plena execução. Detalhes na nossa análise das alterações da API.

Preços e Disponibilidade

O Claude Opus 4.8 está disponível em todo o lado hoje. O preço normal mantém-se inalterado face ao Opus 4.7: $5 por milhão de tokens de input e $25 por milhão de tokens de output. O modo rápido (velocidade 2,5x) tem o preço de $10/M de input e $50/M de output — mas, notavelmente, o modo rápido está agora três vezes mais barato do que era para modelos anteriores. Os programadores acedem ao modelo através da API do Claude usando claude-opus-4-8, e o alias opus agora encaminha para ele automaticamente. Está disponível no Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry e GitHub Copilot (com um multiplicador premium de 15x nos pedidos até à faturação por uso ser lançada a 1 de junho).

Para tirar o máximo partido do Opus 4.8, independentemente da forma como lhe acede, prompts bem estruturados produzem resultados dramaticamente melhores. O Otimizador de Prompts gratuito afia as suas instruções antes de as enviar, e o TresPrompt traz otimização com um clique diretamente para o Claude, ChatGPT e Gemini.

📬 Quer mais conteúdo assim?

Uma ideia prática sobre IA por semana. Mais um pack de prompts grátis ao subscrever.

Subscrever grátis →

O Que Vem Aí: Claude Mythos

A Anthropic usou o anúncio do Opus 4.8 para provocar o que está por vir. A empresa planeia lançar uma nova classe de modelo com inteligência ainda superior à do Opus. Como parte do Projeto Glasswing, um pequeno número de organizações já está a usar o Claude Mythos Preview para trabalho de cibersegurança. Modelos com esse nível de capacidade requerem salvaguardas cibernéticas mais fortes antes do lançamento geral, mas a Anthropic disse que está a fazer progressos rápidos e espera trazer modelos da classe Mythos a todos os clientes "nas próximas semanas". O alinhamento do Opus 4.8 já se aproxima dos níveis do Mythos Preview — um vislumbre do que está por vir. Leia mais na nossa análise da linha temporal do Mythos.

Perguntas Frequentes

Qual é o ID de modelo da API do Claude Opus 4.8?

O ID de modelo da API é claude-opus-4-8. O alias opus agora encaminha para ele automaticamente, pelo que integrações existentes que usem o alias serão atualizadas. Para a variante de contexto de 1 milhão de tokens, use claude-opus-4-8[1m]. Está disponível na API do Claude, Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry.

Quanto custa o Claude Opus 4.8?

O uso normal custa $5 por milhão de tokens de input e $25 por milhão de tokens de output — inalterado face ao Opus 4.7. O modo rápido (velocidade 2,5x) custa $10/M de input e $50/M de output, o que é três vezes mais barato do que o modo rápido era para modelos anteriores. O preço é idêntico em todas as plataformas de cloud.

O Claude Opus 4.8 é melhor que o GPT-5.5?

Depende da tarefa. O Opus 4.8 lidera em programação agentiva (SWE-Bench Pro), uso de computador (OSWorld 83,4%), tarefas de navegador (Online-Mind2Web 84%) e trabalho de conhecimento (GDPval-AA 1890 vs 1769 do GPT-5.5). Mas o GPT-5.5 ainda vence o Terminal-Bench 2.1 (78,2% vs 74,6%) para programação pesada em terminal. Para a maioria do trabalho agentivo e de conhecimento, o Opus 4.8 é mais forte; para longas sessões de terminal, o GPT-5.5 permanece competitivo.

Devo atualizar do Opus 4.7 para o 4.8?

Para a maioria dos utilizadores, sim — é o mesmo preço com melhores benchmarks, honestidade drasticamente melhorada e correções para os problemas de verbosidade nos comentários e chamadas de ferramentas do Opus 4.7. A atualização é automática se usar o alias opus. A principal razão para hesitar: se os seus fluxos de trabalho estão fortemente ajustados ao comportamento do 4.7, volte a testar os seus prompts, uma vez que o discernimento e a verbosidade do modelo mudaram. Veja o nosso guia de decisão de atualização.

O que são fluxos de trabalho dinâmicos no Claude Opus 4.8?

Fluxos de trabalho dinâmicos são uma funcionalidade do Claude Code (pré-visualização de investigação, Max/Team/Enterprise) que permite ao Claude planear uma grande tarefa e executar centenas de subagentes paralelos numa única sessão. Os subagentes atacam problemas de ângulos independentes, agentes adversários tentam refutar descobertas e o sistema itera até as respostas convergirem antes de reportar. O principal caso de uso são migrações à escala da base de código através de centenas de milhares de linhas de código.

Divulgação: Alguns links neste artigo são links de afiliados. Apenas recomendamos ferramentas que testámos pessoalmente e usamos regularmente. Consulte a nossa política de divulgação completa.