Anthropic lançou o Claude Opus 4.8 hoje, 28 de maio de 2026 — apenas 41 dias após o Opus 4.7. O novo modelo principal traz melhorias em programação, tarefas agentivas, raciocínio e trabalho de conhecimento, e chega exatamente pelo mesmo preço do seu antecessor. No mesmo dia, a Anthropic anunciou que levantou 65 bilhões de dólares em financiamento Série H com uma avaliação de 965 bilhões de dólares, ultrapassando oficialmente a OpenAI para se tornar a empresa de IA mais valiosa do mundo. Dois marcos históricos num único dia.
Se você só ler uma coisa sobre o Opus 4.8, leia isto: é uma "melhoria modesta mas tangível" (palavras da própria Anthropic) que avança significativamente três coisas — programação agentiva, honestidade e alinhamento — enquanto introduz três novas funcionalidades que mudam a forma como trabalha com o Claude. Não é o salto gigantesco que o inédito Claude Mythos promete ser, mas resolve problemas reais do Opus 4.7 e estabelece um novo patamar em benchmarks que importam para o trabalho autónomo com IA.
Ponto Essencial
Claude Opus 4.8 (ID da API: claude-opus-4-8) foi lançado a 28 de maio de 2026 com preços inalterados ($5/M de input, $25/M de output). Melhora o SWE-Bench Pro de 64,3% para 69,2%, lidera o OSWorld-Verified com 83,4% e supera o GPT-5.5 e o Gemini 3.1 Pro em trabalho de conhecimento (GDPval-AA 1890). É cerca de 4x menos provável deixar falhas de código passarem sem comentário. Três novas funcionalidades foram lançadas em conjunto: fluxos de trabalho dinâmicos (subagentes paralelos no Claude Code), controlo de esforço (claude.ai e Cowork) e entradas de sistema a meio da tarefa na API de Mensagens. O modo rápido está agora 3x mais barato.
O Que Há de Novo no Claude Opus 4.8?
A principal melhoria é a capacidade agentiva — a capacidade do Claude de trabalhar de forma independente em tarefas de múltiplos passos usando ferramentas. Os primeiros testadores relatam melhor discernimento, melhor uso de ferramentas e maior fiabilidade em fluxos de trabalho de longa duração. O modelo faz as perguntas certas, deteta os seus próprios erros, recua quando um plano não é sólido e constrói confiança em torno de explorações complexas antes de fazer grandes mudanças. Para quem usa o Claude como um agente autónomo em vez de um chatbot, estas são as melhorias que mais importam.
A segunda grande melhoria é a honestidade. A Anthropic treinou todos os seus modelos para evitar fazer afirmações que não possam sustentar, mas os modelos de IA têm um problema persistente: tiram conclusões precipitadas, afirmando confiantemente progresso quando as evidências são escassas. O Opus 4.8 é mais propenso a assinalar incertezas sobre o seu trabalho e menos propenso a fazer afirmações infundadas. As avaliações da Anthropic mostram que é cerca de quatro vezes menos provável do que o Opus 4.7 permitir que falhas no código que escreveu passem sem comentário. É o primeiro modelo Claude a pontuar 0% em relatar acriticamente resultados com falhas, com uma redução de mais de dez vezes no excesso de confiança.
A terceira melhoria é o alinhamento. A equipa de alinhamento da Anthropic concluiu que o Opus 4.8 "atinge novos máximos nas nossas medidas de traços pró-sociais como apoiar a autonomia do utilizador e agir no melhor interesse do utilizador." As suas taxas de comportamento desalinhado — engano ou cooperação com uso indevido — são substancialmente mais baixas do que as do Opus 4.7 e semelhantes às do Claude Mythos Preview, o modelo mais bem alinhado da Anthropic. (Há uma ressalva preocupante sobre a consciência de avaliação, que abordamos na nossa análise aprofundada do paradoxo da honestidade.)
Benchmarks do Claude Opus 4.8: Como se Compara?
A Anthropic publicou benchmarks comparando o Opus 4.8 ao seu antecessor e a modelos concorrentes. Os ganhos são incrementais mas consistentes, e o Opus 4.8 lidera na maioria dos testes agentivos e de trabalho de conhecimento. Eis o detalhe dos números.
| Benchmark | Opus 4.8 | Opus 4.7 | O Que Mede |
|---|---|---|---|
| SWE-Bench Pro | 69,2% | 64,3% | Programação agentiva real |
| OSWorld-Verified | 83,4% | 82,3% | Uso agentivo do computador |
| Online-Mind2Web | 84% | inferior | Tarefas de agente de navegador |
| GDPval-AA | 1890 | — | Trabalho de conhecimento (supera os 1769 do GPT-5.5) |
| Raciocínio c/ ferramentas | 57,9% | 54,7% | Raciocínio multidisciplinar |
| Terminal-Bench 2.1 | 74,6% | — | Programação em terminal (GPT-5.5 vence com 78,2%) |
A conclusão honesta: o Opus 4.8 lidera na maioria dos benchmarks agentivos, de uso de computador e de trabalho de conhecimento, vencendo tanto o GPT-5.5 como o Gemini 3.1 Pro no GDPval-AA por uma larga margem. Mas não é uma vitória total — o GPT-5.5 ainda vence o Terminal-Bench 2.1 (programação pesada em terminal), pontuando 78,2% contra 74,6% do Opus 4.8. Se o seu fluxo de trabalho é dominado por longas sessões de terminal, o GPT-5.5 permanece competitivo. Para um confronto direto completo, veja a nossa análise comparativa dos três modelos.
📬 Isto está a ser útil?
Uma ideia prática sobre IA por semana. Mais um pack de prompts grátis ao subscrever.
Subscrever grátis →As Três Novas Funcionalidades Lançadas com o Opus 4.8
O Opus 4.8 não foi lançado sozinho. A Anthropic disponibilizou três funcionalidades no mesmo dia que mudam a forma como interage com o Claude nos vários produtos.
Fluxos de trabalho dinâmicos (Claude Code). Disponível em pré-visualização de investigação para planos Max, Team e Enterprise, esta funcionalidade permite ao Claude planear uma grande tarefa, despachar centenas de subagentes paralelos que atacam o problema de ângulos independentes, destacar agentes adversários para refutar descobertas e iterar até as respostas convergirem — depois verificar os resultados antes de reportar. O principal caso de uso são migrações à escala da base de código através de centenas de milhares de linhas de código, do início ao merge, usando o conjunto de testes existente como referência. Analisamos isto em detalhe no nosso explicador de fluxos de trabalho dinâmicos.
Controlo de esforço (claude.ai e Cowork). Um novo controlo ao lado do seletor de modelo permite-lhe escolher quanto esforço o Claude dedica a uma resposta. Maior esforço significa que o Claude pensa com mais frequência e profundidade para melhores respostas; menor esforço significa respostas mais rápidas que consomem os seus limites de utilização mais lentamente. Isto está disponível em todos os planos. O nosso guia de controlos de esforço cobre quando usar cada configuração.
Entradas de sistema a meio da tarefa (API de Mensagens). A API de Mensagens agora aceita entradas de sistema dentro do array de mensagens, permitindo aos programadores atualizar as instruções do Claude a meio da tarefa sem quebrar a cache de prompts ou encaminhar através de um turno de utilizador. Isto é importante para agentes que precisam de atualizar permissões, orçamentos de tokens ou contexto de ambiente em plena execução. Detalhes na nossa análise das alterações da API.
Preços e Disponibilidade
O Claude Opus 4.8 está disponível em todo o lado hoje. O preço normal mantém-se inalterado face ao Opus 4.7: $5 por milhão de tokens de input e $25 por milhão de tokens de output. O modo rápido (velocidade 2,5x) tem o preço de $10/M de input e $50/M de output — mas, notavelmente, o modo rápido está agora três vezes mais barato do que era para modelos anteriores. Os programadores acedem ao modelo através da API do Claude usando claude-opus-4-8, e o alias opus agora encaminha para ele automaticamente. Está disponível no Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry e GitHub Copilot (com um multiplicador premium de 15x nos pedidos até à faturação por uso ser lançada a 1 de junho).
Para tirar o máximo partido do Opus 4.8, independentemente da forma como lhe acede, prompts bem estruturados produzem resultados dramaticamente melhores. O Otimizador de Prompts gratuito afia as suas instruções antes de as enviar, e o TresPrompt traz otimização com um clique diretamente para o Claude, ChatGPT e Gemini.
📬 Quer mais conteúdo assim?
Uma ideia prática sobre IA por semana. Mais um pack de prompts grátis ao subscrever.
Subscrever grátis →O Que Vem Aí: Claude Mythos
A Anthropic usou o anúncio do Opus 4.8 para provocar o que está por vir. A empresa planeia lançar uma nova classe de modelo com inteligência ainda superior à do Opus. Como parte do Projeto Glasswing, um pequeno número de organizações já está a usar o Claude Mythos Preview para trabalho de cibersegurança. Modelos com esse nível de capacidade requerem salvaguardas cibernéticas mais fortes antes do lançamento geral, mas a Anthropic disse que está a fazer progressos rápidos e espera trazer modelos da classe Mythos a todos os clientes "nas próximas semanas". O alinhamento do Opus 4.8 já se aproxima dos níveis do Mythos Preview — um vislumbre do que está por vir. Leia mais na nossa análise da linha temporal do Mythos.
Perguntas Frequentes
Qual é o ID de modelo da API do Claude Opus 4.8?
O ID de modelo da API é claude-opus-4-8. O alias opus agora encaminha para ele automaticamente, pelo que integrações existentes que usem o alias serão atualizadas. Para a variante de contexto de 1 milhão de tokens, use claude-opus-4-8[1m]. Está disponível na API do Claude, Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry.
Quanto custa o Claude Opus 4.8?
O uso normal custa $5 por milhão de tokens de input e $25 por milhão de tokens de output — inalterado face ao Opus 4.7. O modo rápido (velocidade 2,5x) custa $10/M de input e $50/M de output, o que é três vezes mais barato do que o modo rápido era para modelos anteriores. O preço é idêntico em todas as plataformas de cloud.
O Claude Opus 4.8 é melhor que o GPT-5.5?
Depende da tarefa. O Opus 4.8 lidera em programação agentiva (SWE-Bench Pro), uso de computador (OSWorld 83,4%), tarefas de navegador (Online-Mind2Web 84%) e trabalho de conhecimento (GDPval-AA 1890 vs 1769 do GPT-5.5). Mas o GPT-5.5 ainda vence o Terminal-Bench 2.1 (78,2% vs 74,6%) para programação pesada em terminal. Para a maioria do trabalho agentivo e de conhecimento, o Opus 4.8 é mais forte; para longas sessões de terminal, o GPT-5.5 permanece competitivo.
Devo atualizar do Opus 4.7 para o 4.8?
Para a maioria dos utilizadores, sim — é o mesmo preço com melhores benchmarks, honestidade drasticamente melhorada e correções para os problemas de verbosidade nos comentários e chamadas de ferramentas do Opus 4.7. A atualização é automática se usar o alias opus. A principal razão para hesitar: se os seus fluxos de trabalho estão fortemente ajustados ao comportamento do 4.7, volte a testar os seus prompts, uma vez que o discernimento e a verbosidade do modelo mudaram. Veja o nosso guia de decisão de atualização.
O que são fluxos de trabalho dinâmicos no Claude Opus 4.8?
Fluxos de trabalho dinâmicos são uma funcionalidade do Claude Code (pré-visualização de investigação, Max/Team/Enterprise) que permite ao Claude planear uma grande tarefa e executar centenas de subagentes paralelos numa única sessão. Os subagentes atacam problemas de ângulos independentes, agentes adversários tentam refutar descobertas e o sistema itera até as respostas convergirem antes de reportar. O principal caso de uso são migrações à escala da base de código através de centenas de milhares de linhas de código.
Divulgação: Alguns links neste artigo são links de afiliados. Apenas recomendamos ferramentas que testámos pessoalmente e usamos regularmente. Consulte a nossa política de divulgação completa.