What is the Claude Opus 4.8 API model ID?

The API model ID is claude-opus-4-8. The opus alias now routes to it automatically, so existing integrations using the alias will upgrade. For the 1-million-token context variant, use claude-opus-4-8[1m]. It's available on the Claude API, Amazon Bedrock, Google Cloud Vertex AI, and Microsoft Foundry.

How much does Claude Opus 4.8 cost?

Regular usage is $5 per million input tokens and $25 per million output tokens — unchanged from Opus 4.7. Fast mode (2.5x speed) costs $10/M input and $50/M output, which is three times cheaper than fast mode was for previous models. Pricing is identical across cloud platforms.

Is Claude Opus 4.8 better than GPT-5.5?

It depends on the task. Opus 4.8 leads on agentic coding (SWE-Bench Pro), computer use (OSWorld 83.4%), browser tasks (Online-Mind2Web 84%), and knowledge work (GDPval-AA 1890 vs GPT-5.5's 1769). But GPT-5.5 still wins Terminal-Bench 2.1 (78.2% vs 74.6%) for terminal-heavy coding. For most agentic and knowledge work, Opus 4.8 is stronger; for long terminal sessions, GPT-5.5 remains competitive.

Should I upgrade from Opus 4.7 to 4.8?

For most users, yes — it's the same price with better benchmarks, dramatically improved honesty, and fixes for Opus 4.7's comment-verbosity and tool-calling issues. The upgrade is automatic if you use the opus alias. The main reason to hesitate: if your workflows are heavily tuned to 4.7's behavior, retest your prompts since the model's judgment and verbosity have changed. See our upgrade decision guide.

What are dynamic workflows in Claude Opus 4.8?

Dynamic workflows is a Claude Code feature (research preview, Max/Team/Enterprise) that lets Claude plan a large task and run hundreds of parallel subagents in a single session. The subagents attack problems from independent angles, adversarial agents try to refute findings, and the system iterates until answers converge before reporting back. The main use case is codebase-scale migrations across hundreds of thousands of lines of code. Disclosure: Some links in this article are affiliate links. We only recommend tools we've personally tested and use regularly. See our full disclosure policy.

Claude Opus 4.8 Chegou: Todas as Novidades, Todos os Benchmarks e o Que Realmente Mudou

Lançado hoje com julgamento mais apurado, modo rápido mais barato e um anúncio de avaliação de US$ 965 bilhões no mesmo dia. Aqui está o panorama completo.

Anthropic lançou o Claude Opus 4.8 hoje, 28 de maio de 2026 — apenas 41 dias após o Opus 4.7. O novo modelo principal traz melhorias em programação, tarefas agentivas, raciocínio e trabalho de conhecimento, e chega exatamente pelo mesmo preço do seu antecessor. No mesmo dia, a Anthropic anunciou que levantou 65 bilhões de dólares em financiamento Série H com uma avaliação de 965 bilhões de dólares, ultrapassando oficialmente a OpenAI para se tornar a empresa de IA mais valiosa do mundo. Dois marcos históricos num único dia.

Se você só ler uma coisa sobre o Opus 4.8, leia isto: é uma "melhoria modesta mas tangível" (palavras da própria Anthropic) que avança significativamente três coisas — programação agentiva, honestidade e alinhamento — enquanto introduz três novas funcionalidades que mudam a forma como trabalha com o Claude. Não é o salto gigantesco que o inédito Claude Mythos promete ser, mas resolve problemas reais do Opus 4.7 e estabelece um novo patamar em benchmarks que importam para o trabalho autónomo com IA.

Ponto Essencial

Claude Opus 4.8 (ID da API: claude-opus-4-8) foi lançado a 28 de maio de 2026 com preços inalterados ($5/M de input, $25/M de output). Melhora o SWE-Bench Pro de 64,3% para 69,2%, lidera o OSWorld-Verified com 83,4% e supera o GPT-5.5 e o Gemini 3.1 Pro em trabalho de conhecimento (GDPval-AA 1890). É cerca de 4x menos provável deixar falhas de código passarem sem comentário. Três novas funcionalidades foram lançadas em conjunto: fluxos de trabalho dinâmicos (subagentes paralelos no Claude Code), controlo de esforço (claude.ai e Cowork) e entradas de sistema a meio da tarefa na API de Mensagens. O modo rápido está agora 3x mais barato.

O Que Há de Novo no Claude Opus 4.8?

A principal melhoria é a capacidade agentiva — a capacidade do Claude de trabalhar de forma independente em tarefas de múltiplos passos usando ferramentas. Os primeiros testadores relatam melhor discernimento, melhor uso de ferramentas e maior fiabilidade em fluxos de trabalho de longa duração. O modelo faz as perguntas certas, deteta os seus próprios erros, recua quando um plano não é sólido e constrói confiança em torno de explorações complexas antes de fazer grandes mudanças. Para quem usa o Claude como um agente autónomo em vez de um chatbot, estas são as melhorias que mais importam.

A segunda grande melhoria é a honestidade. A Anthropic treinou todos os seus modelos para evitar fazer afirmações que não possam sustentar, mas os modelos de IA têm um problema persistente: tiram conclusões precipitadas, afirmando confiantemente progresso quando as evidências são escassas. O Opus 4.8 é mais propenso a assinalar incertezas sobre o seu trabalho e menos propenso a fazer afirmações infundadas. As avaliações da Anthropic mostram que é cerca de quatro vezes menos provável do que o Opus 4.7 permitir que falhas no código que escreveu passem sem comentário. É o primeiro modelo Claude a pontuar 0% em relatar acriticamente resultados com falhas, com uma redução de mais de dez vezes no excesso de confiança.

A terceira melhoria é o alinhamento. A equipa de alinhamento da Anthropic concluiu que o Opus 4.8 "atinge novos máximos nas nossas medidas de traços pró-sociais como apoiar a autonomia do utilizador e agir no melhor interesse do utilizador." As suas taxas de comportamento desalinhado — engano ou cooperação com uso indevido — são substancialmente mais baixas do que as do Opus 4.7 e semelhantes às do Claude Mythos Preview, o modelo mais bem alinhado da Anthropic. (Há uma ressalva preocupante sobre a consciência de avaliação, que abordamos na nossa análise aprofundada do paradoxo da honestidade.)

Benchmarks do Claude Opus 4.8: Como se Compara?

A Anthropic publicou benchmarks comparando o Opus 4.8 ao seu antecessor e a modelos concorrentes. Os ganhos são incrementais mas consistentes, e o Opus 4.8 lidera na maioria dos testes agentivos e de trabalho de conhecimento. Eis o detalhe dos números.

Benchmark	Opus 4.8	Opus 4.7	O Que Mede
SWE-Bench Pro	69,2%	64,3%	Programação agentiva real
OSWorld-Verified	83,4%	82,3%	Uso agentivo do computador
Online-Mind2Web	84%	inferior	Tarefas de agente de navegador
GDPval-AA	1890	—	Trabalho de conhecimento (supera os 1769 do GPT-5.5)
Raciocínio c/ ferramentas	57,9%	54,7%	Raciocínio multidisciplinar
Terminal-Bench 2.1	74,6%	—	Programação em terminal (GPT-5.5 vence com 78,2%)

A conclusão honesta: o Opus 4.8 lidera na maioria dos benchmarks agentivos, de uso de computador e de trabalho de conhecimento, vencendo tanto o GPT-5.5 como o Gemini 3.1 Pro no GDPval-AA por uma larga margem. Mas não é uma vitória total — o GPT-5.5 ainda vence o Terminal-Bench 2.1 (programação pesada em terminal), pontuando 78,2% contra 74,6% do Opus 4.8. Se o seu fluxo de trabalho é dominado por longas sessões de terminal, o GPT-5.5 permanece competitivo. Para um confronto direto completo, veja a nossa análise comparativa dos três modelos.

📬 Isto está a ser útil?

Uma ideia prática sobre IA por semana. Mais um pack de prompts grátis ao subscrever.

Subscrever grátis →

As Três Novas Funcionalidades Lançadas com o Opus 4.8

O Opus 4.8 não foi lançado sozinho. A Anthropic disponibilizou três funcionalidades no mesmo dia que mudam a forma como interage com o Claude nos vários produtos.

Fluxos de trabalho dinâmicos (Claude Code). Disponível em pré-visualização de investigação para planos Max, Team e Enterprise, esta funcionalidade permite ao Claude planear uma grande tarefa, despachar centenas de subagentes paralelos que atacam o problema de ângulos independentes, destacar agentes adversários para refutar descobertas e iterar até as respostas convergirem — depois verificar os resultados antes de reportar. O principal caso de uso são migrações à escala da base de código através de centenas de milhares de linhas de código, do início ao merge, usando o conjunto de testes existente como referência. Analisamos isto em detalhe no nosso explicador de fluxos de trabalho dinâmicos.

Controlo de esforço (claude.ai e Cowork). Um novo controlo ao lado do seletor de modelo permite-lhe escolher quanto esforço o Claude dedica a uma resposta. Maior esforço significa que o Claude pensa com mais frequência e profundidade para melhores respostas; menor esforço significa respostas mais rápidas que consomem os seus limites de utilização mais lentamente. Isto está disponível em todos os planos. O nosso guia de controlos de esforço cobre quando usar cada configuração.

Entradas de sistema a meio da tarefa (API de Mensagens). A API de Mensagens agora aceita entradas de sistema dentro do array de mensagens, permitindo aos programadores atualizar as instruções do Claude a meio da tarefa sem quebrar a cache de prompts ou encaminhar através de um turno de utilizador. Isto é importante para agentes que precisam de atualizar permissões, orçamentos de tokens ou contexto de ambiente em plena execução. Detalhes na nossa análise das alterações da API.

Preços e Disponibilidade

O Claude Opus 4.8 está disponível em todo o lado hoje. O preço normal mantém-se inalterado face ao Opus 4.7: $5 por milhão de tokens de input e $25 por milhão de tokens de output. O modo rápido (velocidade 2,5x) tem o preço de $10/M de input e $50/M de output — mas, notavelmente, o modo rápido está agora três vezes mais barato do que era para modelos anteriores. Os programadores acedem ao modelo através da API do Claude usando claude-opus-4-8, e o alias opus agora encaminha para ele automaticamente. Está disponível no Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry e GitHub Copilot (com um multiplicador premium de 15x nos pedidos até à faturação por uso ser lançada a 1 de junho).

Para tirar o máximo partido do Opus 4.8, independentemente da forma como lhe acede, prompts bem estruturados produzem resultados dramaticamente melhores. O Otimizador de Prompts gratuito afia as suas instruções antes de as enviar, e o TresPrompt traz otimização com um clique diretamente para o Claude, ChatGPT e Gemini.

📬 Quer mais conteúdo assim?

Uma ideia prática sobre IA por semana. Mais um pack de prompts grátis ao subscrever.

Subscrever grátis →

O Que Vem Aí: Claude Mythos

A Anthropic usou o anúncio do Opus 4.8 para provocar o que está por vir. A empresa planeia lançar uma nova classe de modelo com inteligência ainda superior à do Opus. Como parte do Projeto Glasswing, um pequeno número de organizações já está a usar o Claude Mythos Preview para trabalho de cibersegurança. Modelos com esse nível de capacidade requerem salvaguardas cibernéticas mais fortes antes do lançamento geral, mas a Anthropic disse que está a fazer progressos rápidos e espera trazer modelos da classe Mythos a todos os clientes "nas próximas semanas". O alinhamento do Opus 4.8 já se aproxima dos níveis do Mythos Preview — um vislumbre do que está por vir. Leia mais na nossa análise da linha temporal do Mythos.

Perguntas Frequentes

Qual é o ID de modelo da API do Claude Opus 4.8?

O ID de modelo da API é claude-opus-4-8. O alias opus agora encaminha para ele automaticamente, pelo que integrações existentes que usem o alias serão atualizadas. Para a variante de contexto de 1 milhão de tokens, use claude-opus-4-8[1m]. Está disponível na API do Claude, Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry.

Quanto custa o Claude Opus 4.8?

O uso normal custa $5 por milhão de tokens de input e $25 por milhão de tokens de output — inalterado face ao Opus 4.7. O modo rápido (velocidade 2,5x) custa $10/M de input e $50/M de output, o que é três vezes mais barato do que o modo rápido era para modelos anteriores. O preço é idêntico em todas as plataformas de cloud.

O Claude Opus 4.8 é melhor que o GPT-5.5?

Depende da tarefa. O Opus 4.8 lidera em programação agentiva (SWE-Bench Pro), uso de computador (OSWorld 83,4%), tarefas de navegador (Online-Mind2Web 84%) e trabalho de conhecimento (GDPval-AA 1890 vs 1769 do GPT-5.5). Mas o GPT-5.5 ainda vence o Terminal-Bench 2.1 (78,2% vs 74,6%) para programação pesada em terminal. Para a maioria do trabalho agentivo e de conhecimento, o Opus 4.8 é mais forte; para longas sessões de terminal, o GPT-5.5 permanece competitivo.

Devo atualizar do Opus 4.7 para o 4.8?

Para a maioria dos utilizadores, sim — é o mesmo preço com melhores benchmarks, honestidade drasticamente melhorada e correções para os problemas de verbosidade nos comentários e chamadas de ferramentas do Opus 4.7. A atualização é automática se usar o alias opus. A principal razão para hesitar: se os seus fluxos de trabalho estão fortemente ajustados ao comportamento do 4.7, volte a testar os seus prompts, uma vez que o discernimento e a verbosidade do modelo mudaram. Veja o nosso guia de decisão de atualização.

O que são fluxos de trabalho dinâmicos no Claude Opus 4.8?

Fluxos de trabalho dinâmicos são uma funcionalidade do Claude Code (pré-visualização de investigação, Max/Team/Enterprise) que permite ao Claude planear uma grande tarefa e executar centenas de subagentes paralelos numa única sessão. Os subagentes atacam problemas de ângulos independentes, agentes adversários tentam refutar descobertas e o sistema itera até as respostas convergirem antes de reportar. O principal caso de uso são migrações à escala da base de código através de centenas de milhares de linhas de código.

Divulgação: Alguns links neste artigo são links de afiliados. Apenas recomendamos ferramentas que testámos pessoalmente e usamos regularmente. Consulte a nossa política de divulgação completa.