Google lanceerde Gemini 3.1 met een contextvenster van 2 miljoen tokens. Ieder nieuwsbericht behandelde dit als een doorbraak. En voor specifieke toepassingen — het verwerken van complete codebases, het analyseren van boeken, het doorzoeken van uren video — is dat ook zo. Maar de marketing creëerde een gevaarlijke aanname: meer context = betere output.

Dat klopt niet. Bij de meeste taken in de praktijk is de kwaliteit van je context belangrijker dan de hoeveelheid. Een gerichte prompt van 5.000 tokens met precies de juiste informatie levert betere resultaten op dan een dump van 500.000 tokens met alles wat vaag relevant is.

Belangrijkste boodschap

Contextvensters zijn als opslagruimte: een grotere garage maakt je geen betere chauffeur. Wat telt is wat je in de context stopt — niet hoeveel ruimte beschikbaar is. Context engineering (het selecteren van de JUÍSTE context) is de vaardigheid die betere resultaten oplevert, niet de grootte van het contextvenster.

Waarom betekent meer context niet automatisch betere output?

Het "verloren in het midden"-probleem. Onderzoek toont keer op keer aan dat LLM’s minder aandacht besteden aan informatie die in het midden van lange contexten staat. Informatie aan het begin en einde wordt nauwkeuriger verwerkt dan informatie die op positie 100.000 begraven ligt. Dit is geen bug — het is een fundamentele eigenschap van transformer attention-mechanismen. Het dumpen van 2M tokens context betekent dat een aanzienlijk deel van die context effectief onzichtbaar is voor het model.

Signaal-ruisverhouding. Wanneer je een volledige codebase in een 2M contextvenster laadt, is het merendeel van die code irrelevant voor je specifieke vraag. Het model moet uitzoeken welke bestanden ertoe doen — en dat lukt niet altijd. Een gerichte upload van de 3-5 relevante bestanden levert nauwkeurigere antwoorden op dan een dump van de volledige repository.

Tokenkosten schalen met de context. Het verwerken van 2M tokens kost dramatisch meer dan het verwerken van 5K tokens. Voor routine-taken — e-mails opstellen, samenvattingen schrijven, vragen beantwoorden — betaal je 400x meer voor een marginale (of nul) kwaliteitsverbetering.

Contextaanpak Outputkwaliteit Kosten Snelheid
5K tokens gerichte contextUitstekend — model richt zich precies op wat ertoe doetMinimaalSnel
50K tokens relevante documentenZeer goed — meer context helpt bij complexe takenMatigGoed
500K+ tokens volledige dumpWisselend — hangt af van taak en "verloren in het midden"-effectenHoogLangzaam
2M tokens maximaal gevuldAlleen nuttig voor specifieke taken (codebase-zoekopdrachten, boekanalyse)Zeer hoogZeer langzaam
---

📬 Heb je hier iets aan? We doorprikken AI-marketing met praktische analyses, elke week. Ontvang het in je inbox →

---

Wanneer maken grote contextvensters wél verschil?

Grote contextvensters helpen echt in precies drie scenario’s:

1. Zoeken in grote documenten naar specifieke informatie. "Vind elke vermelding van ‘annuleringsbeleid’ in deze 50 contracten." Dit is ophalen, geen analyse — en meer context betekent meer documenten om te doorzoeken.

2. Kruisverwijzingen tussen meerdere bronnen. "Vergelijk de methodologie-secties van deze 20 onderzoekspapers." Dit vereist dat meerdere documenten tegelijk zichtbaar zijn — onmogelijk met kleine contextvensters.

3. Analyseren van volledige codebases. "Vind alle functies die de payment API aanroepen en controleer op foutafhandeling." Dit vraagt om zichtbaarheid over het hele project. Claude Code lost dit op met CLAUDE.md-bestanden in plaats van rauwe context, maar de aanpak van Gemini om alles te laden werkt ook.

Voor alles wat daarbuiten valt — schrijven, concepten maken, samenvatten, analyseren van losse documenten, vragen beantwoorden, content creëren — wint contextkwaliteit het elke keer van contexthoeveelheid.

De vaardigheid die telt is context engineering — het selecteren van de juiste 5.000 tokens uit je beschikbare informatie. De Prompt Optimizer helpt hierbij door prompts zo te structureren dat de meest relevante context in het meest effectieve formaat staat.

---

📬 Meer van dit soort analyses? Tegendraadse AI-analyses onderbouwd met onderzoek. Gratis inschrijven →

---

Veelgestelde vragen

Dus het 2M contextvenster van Gemini is nutteloos?

Helemaal niet. Voor de specifieke toepassingen hierboven (zoeken in grote documenten, kruisverwijzingen, codebase-analyse) is het echt transformatief. Het punt is dat contextvenstergrootte wordt gepromoot als algemene kwaliteitsverbetering, terwijl het eigenlijk een gespecialiseerde mogelijkheid is. De meeste dagelijkse AI-taken profiteren van gerichte context, niet van massa’s context.

Moet ik mijn AI-model kiezen op basis van het contextvenster?

Alleen als je regelmatig werkt met zeer grote documenten of codebases. Voor de meeste gebruikers tellen de kwaliteitsverschillen tussen modellen (schrijfkvaliteit van Claude, doorvoer van GPT, multimodale mogelijkheden van Gemini) veel zwaarder dan de grootte van het contextvenster.

Wat is de ideale promptlengte?

Voor de meeste taken levert 200-500 woorden goed gestructureerde context (het ICCSSE-framework) optimale resultaten op. Daarboven krijg je afnemende meerwaarde, tenzij je daadwerkelijke referentiedocumenten toevoegt die de AI moet analyseren.

Transparantie: Sommige links in dit artikel zijn affiliate links. We raden alleen tools aan die we zelf hebben getest en regelmatig gebruiken. Zie ons volledige transparantiebeleid.