Anthropic udgav Claude Opus 4.8 i dag, den 28. maj 2026 — kun 41 dage efter Opus 4.7. Den nye flagskibsmodel bringer forbedringer inden for kodning, agentiske opgaver, ræsonnement og vidensarbejde, og den lanceres til præcis samme pris som sin forgænger. Samme dag annoncerede Anthropic, at de har rejst 65 milliarder dollars i serie H-finansiering til en værdiansættelse på 965 milliarder dollars, hvilket officielt overhaler OpenAI og gør dem til verdens mest værdifulde AI-virksomhed. To historiske milepæle på en enkelt dag.
Hvis du kun læser én ting om Opus 4.8, så læs dette: det er en "beskeden men mærkbar forbedring" (Anthropics egne ord), der på meningsfuld vis fremmer tre ting — agentisk kodning, ærlighed og alignment — samtidig med at den introducerer tre nye funktioner, der ændrer måden, du arbejder med Claude på. Det er ikke det kvantespring, som den endnu ikke udgivne Claude Mythos lover at blive, men den løser reelle problemer fra Opus 4.7 og sætter en ny standard på benchmarks, der betyder noget for autonomt AI-arbejde.
Hovedpointe
Claude Opus 4.8 (API ID: claude-opus-4-8) blev lanceret den 28. maj 2026 til uændret pris ($5/M input, $25/M output). Den forbedrer SWE-Bench Pro fra 64,3% til 69,2%, fører på OSWorld-Verified med 83,4% og topper GPT-5.5 og Gemini 3.1 Pro på vidensarbejde (GDPval-AA 1890). Den er ca. 4x mindre tilbøjelig til at lade kodefejl passere ubemærket. Tre nye funktioner blev lanceret sammen med den: dynamiske arbejdsgange (parallelle underagenter i Claude Code), indsatskontrol (claude.ai og Cowork) og midtvejs systemindtastninger i Messages API. Hurtig tilstand er nu 3x billigere.
Hvad er nyt i Claude Opus 4.8?
Den største forbedring er agentisk kapacitet — Claudes evne til at arbejde selvstændigt gennem flertrinsopgaver ved hjælp af værktøjer. Tidlige testere rapporterer skarpere dømmekraft, bedre værktøjsbrug og forbedret pålidelighed ved langvarige arbejdsgange. Modellen stiller de rigtige spørgsmål, fanger sine egne fejl, siger fra når en plan ikke er solid og opbygger tillid omkring komplekse udforskninger, før der foretages store ændringer. For alle, der bruger Claude som en autonom agent snarere end en chatbot, er det disse forbedringer, der betyder mest.
Den anden store forbedring er ærlighed. Anthropic har trænet alle sine modeller til at undgå at fremsætte påstande, de ikke kan understøtte, men AI-modeller har et vedvarende problem: de drager forhastede konklusioner og hævder selvsikkert fremskridt, når beviserne er spinkle. Opus 4.8 er mere tilbøjelig til at markere usikkerhed omkring sit arbejde og mindre tilbøjelig til at fremsætte udokumenterede påstande. Anthropics evalueringer viser, at den er omkring fire gange mindre tilbøjelig end Opus 4.7 til at lade fejl i kode, den har skrevet, passere ubemærket. Det er den første Claude-model, der scorer 0% på ukritisk rapportering af fejlbehæftede resultater, med en mere end tidoblet reduktion i overdreven selvtillid.
Den tredje forbedring er alignment. Anthropics alignment-team konkluderede, at Opus 4.8 "når nye højder på vores målinger af prosociale træk som at understøtte brugerautonomi og handle i brugerens bedste interesse." Dens rater for misaligned adfærd — bedrag eller samarbejde om misbrug — er væsentligt lavere end Opus 4.7 og ligner Claude Mythos Preview, Anthropics bedst alignede model. (Der er ét bekymrende forbehold omkring evalueringsbevidsthed, som vi dækker i vores dybdegående artikel om ærlighedsparadokset.)
Claude Opus 4.8 Benchmarks: Hvordan sammenligner den sig?
Anthropic offentliggjorde benchmarks, der sammenligner Opus 4.8 med dens forgænger og med konkurrerende modeller. Gevinsterne er inkrementelle men konsistente, og Opus 4.8 fører på de fleste agentiske og vidensorienterede tests. Her er, hvordan tallene fordeler sig.
| Benchmark | Opus 4.8 | Opus 4.7 | Hvad den måler |
|---|---|---|---|
| SWE-Bench Pro | 69,2% | 64,3% | Virkelighedsnær agentisk kodning |
| OSWorld-Verified | 83,4% | 82,3% | Agentisk computerbrug |
| Online-Mind2Web | 84% | lavere | Browser-agent opgaver |
| GDPval-AA | 1890 | — | Vidensarbejde (slår GPT-5.5's 1769) |
| Ræsonnement m/ værktøjer | 57,9% | 54,7% | Tværfagligt ræsonnement |
| Terminal-Bench 2.1 | 74,6% | — | Terminalkodning (GPT-5.5 vinder med 78,2%) |
Den ærlige konklusion: Opus 4.8 fører på de fleste agentiske, computerbrugs- og vidensorienterede benchmarks og slår både GPT-5.5 og Gemini 3.1 Pro på GDPval-AA med en bred margin. Men det er ikke en total sejr — GPT-5.5 vinder stadig Terminal-Bench 2.1 (terminaltung kodning) med 78,2% mod Opus 4.8's 74,6%. Hvis din arbejdsgang domineres af lange terminalsessioner, forbliver GPT-5.5 konkurrencedygtig. For en komplet head-to-head, se vores trevejs benchmark-gennemgang.
📬 Får du værdi af dette?
Én brugbar AI-indsigt om ugen. Plus en gratis prompt-pakke, når du abonnerer.
Abonnér gratis →De tre nye funktioner, der lanceres med Opus 4.8
Opus 4.8 blev ikke lanceret alene. Anthropic udsendte samme dag tre funktioner, der ændrer, hvordan du interagerer med Claude på tværs af produkter.
Dynamiske arbejdsgange (Claude Code). Tilgængelig i research preview for Max-, Team- og Enterprise-planer. Denne funktion lader Claude planlægge en stor opgave, udsende hundredvis af parallelle underagenter, der angriber problemet fra uafhængige vinkler, deployere kontradiktoriske agenter til at modbevise resultater og iterere, indtil svarene konvergerer — for derefter at verificere output, før der rapporteres tilbage. Det primære anvendelsesområde er migrationer på tværs af kodebaser med hundredtusindvis af linjer kode, fra opstart til merge, med brug af den eksisterende testpakke som standard. Vi gennemgår dette fuldt ud i vores forklaring af dynamiske arbejdsgange.
Indsatskontrol (claude.ai og Cowork). En ny kontrol ved siden af modelvælgeren lader dig vælge, hvor meget indsats Claude lægger i et svar. Højere indsats betyder, at Claude tænker hyppigere og dybere for bedre svar; lavere indsats betyder hurtigere svar, der bruger dine rate limits langsommere. Dette er tilgængeligt på alle planer. Vores guide til indsatskontrol dækker, hvornår hver indstilling skal bruges.
Midtvejs systemindtastninger (Messages API). Messages API accepterer nu systemindtastninger inde i messages-arrayet, hvilket lader udviklere opdatere Claudes instruktioner midt i en opgave uden at bryde prompt-cachen eller dirigere gennem en bruger-tur. Dette er vigtigt for agenter, der har brug for at opdatere tilladelser, token-budgetter eller miljøkontekst midt i et forløb. Detaljer i vores API-ændringsgennemgang.
Priser og tilgængelighed
Claude Opus 4.8 er tilgængelig overalt i dag. Almindelig prissætning er uændret fra Opus 4.7: $5 per million input-tokens og $25 per million output-tokens. Hurtig tilstand (2,5x hastighed) er prissat til $10/M input og $50/M output — men bemærkelsesværdigt nok er hurtig tilstand nu tre gange billigere, end den var for tidligere modeller. Udviklere tilgår modellen via Claude API med claude-opus-4-8, og opus-aliaset dirigerer nu automatisk til den. Den er tilgængelig på Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry og GitHub Copilot (med en 15x premium-forespørgselsmultiplikator, indtil forbrugsbaseret fakturering lanceres den 1. juni).
For at få mest muligt ud af Opus 4.8, uanset hvordan du tilgår den, giver velstrukturerede prompts dramatisk bedre resultater. Den gratis Prompt Optimizer skærper dine instruktioner, før du sender dem, og TresPrompt bringer et-kliks optimering direkte ind i Claude, ChatGPT og Gemini.
📬 Vil du have mere som dette?
Én brugbar AI-indsigt om ugen. Plus en gratis prompt-pakke, når du abonnerer.
Abonnér gratis →Hvad er det næste: Claude Mythos
Anthropic brugte Opus 4.8-annonceringen til at tease, hvad der er på vej. Virksomheden planlægger at udgive en ny klasse af modeller med endnu højere intelligens end Opus. Som en del af Project Glasswing bruger et lille antal organisationer allerede Claude Mythos Preview til cybersikkerhedsarbejde. Modeller på det kapacitetsniveau kræver stærkere cybersikkerhedsforanstaltninger før generel udgivelse, men Anthropic sagde, at de gør hurtige fremskridt og forventer at bringe modeller i Mythos-klassen til alle kunder "i de kommende uger." Opus 4.8's alignment nærmer sig allerede Mythos Preview-niveauer — et hint om, hvad der er på vej. Læs mere i vores Mythos-tidslinjeanalyse.
Ofte stillede spørgsmål
Hvad er Claude Opus 4.8 API-model-ID'et?
API-model-ID'et er claude-opus-4-8. Opus-aliaset dirigerer nu automatisk til den, så eksisterende integrationer, der bruger aliaset, vil opgradere. For varianten med 1-million-tokens kontekst, brug claude-opus-4-8[1m]. Den er tilgængelig på Claude API, Amazon Bedrock, Google Cloud Vertex AI og Microsoft Foundry.
Hvor meget koster Claude Opus 4.8?
Almindelig brug koster $5 per million input-tokens og $25 per million output-tokens — uændret fra Opus 4.7. Hurtig tilstand (2,5x hastighed) koster $10/M input og $50/M output, hvilket er tre gange billigere end hurtig tilstand var for tidligere modeller. Priserne er identiske på tværs af cloud-platforme.
Er Claude Opus 4.8 bedre end GPT-5.5?
Det afhænger af opgaven. Opus 4.8 fører på agentisk kodning (SWE-Bench Pro), computerbrug (OSWorld 83,4%), browseropgaver (Online-Mind2Web 84%) og vidensarbejde (GDPval-AA 1890 mod GPT-5.5's 1769). Men GPT-5.5 vinder stadig Terminal-Bench 2.1 (78,2% mod 74,6%) for terminaltung kodning. Til det meste agentisk og vidensorienteret arbejde er Opus 4.8 stærkere; til lange terminalsessioner forbliver GPT-5.5 konkurrencedygtig.
Bør jeg opgradere fra Opus 4.7 til 4.8?
For de fleste brugere, ja — det er samme pris med bedre benchmarks, dramatisk forbedret ærlighed og rettelser til Opus 4.7's kommentar-udførlighed og værktøjskaldsproblemer. Opgraderingen er automatisk, hvis du bruger opus-aliaset. Den primære grund til at tøve: hvis dine arbejdsgange er stærkt tunet til 4.7's adfærd, bør du genteste dine prompts, da modellens dømmekraft og udførlighed har ændret sig. Se vores opgraderingsbeslutningsguide.
Hvad er dynamiske arbejdsgange i Claude Opus 4.8?
Dynamiske arbejdsgange er en Claude Code-funktion (research preview, Max/Team/Enterprise), der lader Claude planlægge en stor opgave og køre hundredvis af parallelle underagenter i en enkelt session. Underagenterne angriber problemer fra uafhængige vinkler, kontradiktoriske agenter forsøger at modbevise resultater, og systemet itererer, indtil svarene konvergerer, før der rapporteres tilbage. Det primære anvendelsesområde er migrationer på tværs af kodebaser med hundredtusindvis af linjer kode.
Offentliggørelse: Nogle links i denne artikel er affiliate-links. Vi anbefaler kun værktøjer, vi personligt har testet og bruger regelmæssigt. Se vores fulde offentliggørelsespolitik.