Anthropic heeft vandaag, 28 mei 2026, Claude Opus 4.8 uitgebracht — slechts 41 dagen na Opus 4.7. Het nieuwe vlaggenschipmodel brengt verbeteringen op het gebied van coderen, agentische taken, redeneren en kenniswerk, en wordt geleverd tegen exact dezelfde prijs als zijn voorganger. Op dezelfde dag kondigde Anthropic aan dat het 65 miljard dollar heeft opgehaald in een Series H-financieringsronde tegen een waardering van 965 miljard dollar, waarmee het officieel OpenAI voorbijstreeft als het meest waardevolle AI-bedrijf ter wereld. Twee historische mijlpalen op één dag.

Als je maar één ding leest over Opus 4.8, lees dan dit: het is een "bescheiden maar tastbare verbetering" (Anthropic's eigen woorden) die betekenisvolle vooruitgang boekt op drie vlakken — agentisch coderen, eerlijkheid en alignment — en introduceert drie nieuwe functies die veranderen hoe je met Claude werkt. Het is niet de reuzensprong die de onaangekondigde Claude Mythos belooft te worden, maar het lost echte problemen van Opus 4.7 op en zet een nieuwe standaard op benchmarks die ertoe doen voor autonoom AI-werk.

Belangrijkste conclusie

Claude Opus 4.8 (API ID: claude-opus-4-8) gelanceerd op 28 mei 2026 tegen ongewijzigde prijzen ($5/M input, $25/M output). Het verbetert SWE-Bench Pro van 64,3% naar 69,2%, leidt op OSWorld-Verified met 83,4% en overtreft GPT-5.5 en Gemini 3.1 Pro op kenniswerk (GDPval-AA 1890). Het is ongeveer 4x minder waarschijnlijk dat codefouten onopgemerkt blijven. Drie nieuwe functies werden gelijktijdig gelanceerd: dynamische workflows (parallelle subagents in Claude Code), inspanningscontrole (claude.ai en Cowork) en mid-taak systeeminvoer in de Messages API. Fast mode is nu 3x goedkoper.

Wat is er nieuw in Claude Opus 4.8?

De belangrijkste verbetering is agentische capaciteit — Claude's vermogen om zelfstandig te werken aan meerstapstaken met behulp van tools. Vroege testers rapporteren scherper beoordelingsvermogen, beter toolgebruik en verbeterde betrouwbaarheid bij langlopende workflows. Het model stelt de juiste vragen, vangt zijn eigen fouten op, biedt weerstand wanneer een plan niet deugdelijk is en bouwt vertrouwen op rond complexe verkenningen voordat het grote wijzigingen doorvoert. Voor iedereen die Claude gebruikt als autonome agent in plaats van als chatbot, zijn dit de verbeteringen die er het meest toe doen.

De tweede grote verbetering is eerlijkheid. Anthropic heeft al zijn modellen getraind om beweringen te vermijden die ze niet kunnen onderbouwen, maar AI-modellen hebben een hardnekkig probleem: ze trekken overhaaste conclusies en beweren vol vertrouwen vooruitgang te boeken wanneer het bewijs dun is. Opus 4.8 is eerder geneigd onzekerheden over zijn werk te signaleren en minder geneigd ongefundeerde beweringen te doen. Uit evaluaties van Anthropic blijkt dat het ongeveer vier keer minder waarschijnlijk is dan Opus 4.7 om fouten in code die het heeft geschreven onopgemerkt te laten. Het is het eerste Claude-model dat 0% scoort op het kritiekloos rapporteren van gebrekkige resultaten, met een meer dan tienvoudige vermindering van overmoed.

De derde verbetering is alignment. Het alignment-team van Anthropic concludeerde dat Opus 4.8 "nieuwe hoogten bereikt op onze metingen van prosociale eigenschappen zoals het ondersteunen van gebruikersautonomie en handelen in het belang van de gebruiker." De percentages van niet-afgestemd gedrag — misleiding of medewerking aan misbruik — zijn aanzienlijk lager dan bij Opus 4.7 en vergelijkbaar met Claude Mythos Preview, Anthropic's best afgestemde model. (Er is één zorgwekkend voorbehoud met betrekking tot evaluatiebewustzijn, dat we behandelen in onze diepgaande analyse van de eerlijkheidsparadox.)

Claude Opus 4.8 Benchmarks: Hoe verhoudt het zich?

Anthropic publiceerde benchmarks die Opus 4.8 vergelijken met zijn voorganger en met concurrerende modellen. De winst is incrementeel maar consistent, en Opus 4.8 leidt op de meeste agentische en kenniswerktests. Hier is hoe de cijfers uiteenvallen.

Benchmark Opus 4.8 Opus 4.7 Wat het meet
SWE-Bench Pro69,2%64,3%Praktijkgericht agentisch coderen
OSWorld-Verified83,4%82,3%Agentisch computergebruik
Online-Mind2Web84%lagerBrowser-agenttaken
GDPval-AA1890Kenniswerk (overtreft GPT-5.5's 1769)
Redeneren met tools57,9%54,7%Multidisciplinair redeneren
Terminal-Bench 2.174,6%Terminal-coderen (GPT-5.5 wint met 78,2%)

De eerlijke conclusie: Opus 4.8 leidt op de meeste agentische, computergebruik- en kenniswerkbenchmarks en overtreft zowel GPT-5.5 als Gemini 3.1 Pro op GDPval-AA met een ruime marge. Maar het is geen onbetwiste overwinning — GPT-5.5 wint nog steeds Terminal-Bench 2.1 (terminal-intensief coderen), met 78,2% tegenover Opus 4.8's 74,6%. Als je workflow wordt gedomineerd door lange terminalsessies, blijft GPT-5.5 concurrerend. Voor een volledige onderlinge vergelijking, zie onze drieweg-benchmarkanalyse.

📬 Haal je hier waarde uit?

Eén bruikbaar AI-inzicht per week. Plus een gratis promptpakket bij inschrijving.

Gratis abonneren →

De drie nieuwe functies die met Opus 4.8 worden gelanceerd

Opus 4.8 werd niet alleen gelanceerd. Anthropic bracht dezelfde dag drie functies uit die veranderen hoe je met Claude werkt in verschillende producten.

Dynamische workflows (Claude Code). Beschikbaar in research preview voor Max-, Team- en Enterprise-abonnementen. Met deze functie kan Claude een grote taak plannen, honderden parallelle subagents inzetten die het probleem vanuit onafhankelijke invalshoeken aanpakken, adversariële agents inzetten om bevindingen te weerleggen, en itereren totdat antwoorden convergeren — om vervolgens de output te verifiëren voordat er wordt gerapporteerd. De belangrijkste use case is codebase-brede migraties over honderdduizenden regels code, van start tot merge, met de bestaande testsuite als maatstaf. We analyseren dit volledig in onze uitleg over dynamische workflows.

Inspanningscontrole (claude.ai en Cowork). Een nieuwe controleknop naast de modelkiezer waarmee je kunt kiezen hoeveel inspanning Claude in een antwoord steekt. Hogere inspanning betekent dat Claude vaker en dieper nadenkt voor betere antwoorden; lagere inspanning betekent snellere antwoorden die je limieten langzamer verbruiken. Dit is beschikbaar op alle abonnementen. Onze gids voor inspanningscontrole behandelt wanneer je elke instelling het beste kunt gebruiken.

Mid-taak systeeminvoer (Messages API). De Messages API accepteert nu systeeminvoer binnen de berichtenreeks, waardoor ontwikkelaars Claude's instructies mid-taak kunnen bijwerken zonder de promptcache te verbreken of via een gebruikersbeurt te hoeven gaan. Dit is belangrijk voor agents die permissies, tokenbudgetten of omgevingscontext tijdens de uitvoering moeten bijwerken. Details in onze API-wijzigingsanalyse.

Prijzen en beschikbaarheid

Claude Opus 4.8 is vandaag overal beschikbaar. De reguliere prijzen zijn ongewijzigd ten opzichte van Opus 4.7: $5 per miljoen inputtokens en $25 per miljoen outputtokens. Fast mode (2,5x snelheid) is geprijsd op $10/M input en $50/M output — maar opmerkelijk is dat fast mode nu drie keer goedkoper is dan bij eerdere modellen. Ontwikkelaars benaderen het model via de Claude API met claude-opus-4-8, en de opus-alias routeert er nu automatisch naartoe. Het is beschikbaar op Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry en GitHub Copilot (met een 15x premium-verzoekmultiplier totdat verbruiksgebaseerde facturering op 1 juni van start gaat).

Om het maximale uit Opus 4.8 te halen, ongeacht hoe je het benadert, leveren goed gestructureerde prompts dramatisch betere resultaten op. De gratis Prompt Optimizer scherpt je instructies aan voordat je ze verzendt, en TresPrompt brengt optimalisatie met één klik rechtstreeks naar Claude, ChatGPT en Gemini.

📬 Wil je meer zoals dit?

Eén bruikbaar AI-inzicht per week. Plus een gratis promptpakket bij inschrijving.

Gratis abonneren →

Wat volgt: Claude Mythos

Anthropic gebruikte de Opus 4.8-aankondiging om een voorproefje te geven van wat eraan komt. Het bedrijf is van plan een nieuwe modelklasse uit te brengen met nog hogere intelligentie dan Opus. Als onderdeel van Project Glasswing gebruikt een klein aantal organisaties al Claude Mythos Preview voor cybersecuritywerk. Modellen op dat capaciteitsniveau vereisen sterkere cyberbeveiliging voordat ze algemeen worden vrijgegeven, maar Anthropic zei snelle vooruitgang te boeken en verwacht Mythos-klasse modellen "in de komende weken" voor alle klanten beschikbaar te stellen. Opus 4.8's alignment benadert nu al Mythos Preview-niveaus — een hint van wat eraan komt. Lees meer in onze Mythos-tijdlijnanalyse.

Veelgestelde vragen

Wat is de Claude Opus 4.8 API-model-ID?

De API-model-ID is claude-opus-4-8. De opus-alias routeert er nu automatisch naartoe, dus bestaande integraties die de alias gebruiken, worden geüpgraded. Gebruik voor de 1-miljoen-token contextvariant claude-opus-4-8[1m]. Het is beschikbaar op de Claude API, Amazon Bedrock, Google Cloud Vertex AI en Microsoft Foundry.

Hoeveel kost Claude Opus 4.8?

Regulier gebruik kost $5 per miljoen inputtokens en $25 per miljoen outputtokens — ongewijzigd ten opzichte van Opus 4.7. Fast mode (2,5x snelheid) kost $10/M input en $50/M output, wat drie keer goedkoper is dan fast mode bij eerdere modellen. De prijzen zijn identiek op alle cloudplatforms.

Is Claude Opus 4.8 beter dan GPT-5.5?

Het hangt af van de taak. Opus 4.8 leidt op agentisch coderen (SWE-Bench Pro), computergebruik (OSWorld 83,4%), browsertaken (Online-Mind2Web 84%) en kenniswerk (GDPval-AA 1890 vs GPT-5.5's 1769). Maar GPT-5.5 wint nog steeds Terminal-Bench 2.1 (78,2% vs 74,6%) voor terminal-intensief coderen. Voor de meeste agentische en kenniswerktaken is Opus 4.8 sterker; voor lange terminalsessies blijft GPT-5.5 concurrerend.

Moet ik upgraden van Opus 4.7 naar 4.8?

Voor de meeste gebruikers: ja — het is dezelfde prijs met betere benchmarks, aanzienlijk verbeterde eerlijkheid en oplossingen voor Opus 4.7's problemen met commentaar-uitgebreidheid en tool-calling. De upgrade is automatisch als je de opus-alias gebruikt. De belangrijkste reden om te aarzelen: als je workflows sterk zijn afgestemd op het gedrag van 4.7, test dan je prompts opnieuw omdat het beoordelingsvermogen en de uitgebreidheid van het model zijn veranderd. Zie onze beslisgids voor upgraden.

Wat zijn dynamische workflows in Claude Opus 4.8?

Dynamische workflows is een Claude Code-functie (research preview, Max/Team/Enterprise) waarmee Claude een grote taak kan plannen en honderden parallelle subagents in één sessie kan uitvoeren. De subagents pakken problemen vanuit onafhankelijke invalshoeken aan, adversariële agents proberen bevindingen te weerleggen, en het systeem itereert totdat antwoorden convergeren voordat er wordt gerapporteerd. De belangrijkste use case is codebase-brede migraties over honderdduizenden regels code.

Openbaarmaking: Sommige links in dit artikel zijn affiliatielinks. We bevelen alleen tools aan die we persoonlijk hebben getest en regelmatig gebruiken. Zie ons volledige openbaarmakingsbeleid.