En vag 10-ords prompt, der kræver 4 runder med præcisering, koster flere tokens end en præcis 80-ords prompt, der virker første gang. Den dyreste AI-interaktion er ikke den lange — det er den, du skal gentage. Her er 8 teknikker, der reducerer tokenforbruget med halvdelen på tværs af Claude Code, Cursor og alle andre AI-kodningsværktøjer.

Vigtige fakta
  • Grundårsag: 60% af tokenspild kommer fra at genforklare kontekst og iterere på vage prompts
  • Største løftestang: At starte friske samtaler (sparer genlæsning af hele historien)
  • Anden løftestang: Bedre prompts (en god prompt erstatter 3-4 dårlige)
  • Værktøjer, der hjælper: Caveman (outputkompression), Code Burn (brugsovervågning)
  • Gælder for: Claude Code, Cursor, GitHub Copilot, Windsurf — alle sammen
  • Sidst verificeret: April 2026

Hvorfor tokenspild sker

Alle AI-kodningsværktøjer fungerer på samme måde under overfladen: din prompt plus hele samtalehistorikken sendes til modellen med hver besked. Besked 1 er billig. Besked 20 er dyr — fordi modellen genlæser alle 19 tidligere beskeder, før den genererer et svar.

Dette betyder, at det største tokendræn ikke er komplekse prompts. Det er lange samtaler. En 30-besked-samtale, hvor hver besked genlæser hele historien, koster cirka 5x hvad seks separate 5-besked-samtaler ville koste for det samme samlede arbejde.

Det anden dræn er iteration. "Tilføj auth" → "Nej, jeg mente OAuth" → "Med Google-udbyder" → "Og tilføj rate limiting" → "Håndter også refresh tokens" koster fem interaktioner, når en detaljeret prompt ville have fået det rigtigt første gang: "Tilføj OAuth-godkendelse med Google-udbyder, inkluderet rate limiting på auth-endepunkterne og refresh token-håndtering."

De 8 teknikker

1. Start friske samtaler hver 15-20 beskeder. Dette er den enkelt vigtigste vane. Opsummér dit nuværende fremskridt i 3-4 sætninger, start en ny chat, indsæt sammenfattelsen som kontekst. Dit tokenforbrug pr. besked falder tilbage til baseline.

2. Skriv prompts som overgivelsesdokumenter. Medtag hvad der findes, hvad du ønsker ændret, hvad der IKKE skal røres, og det forventede resultat. En præcis prompt erstatter 3-4 vage. Netto tokenbesparing: 60-70%.

3. Brug den rigtige model til opgaven. Claude Sonnet til rutinerediteringer. Opus til kompleks ræsonnering. Brug ikke den mest kraftfulde (og dyreste) model til opgaver, der ikke har brug for det. I Cursor skal du manuelt vælge modellen i stedet for at bruge standard.

4. Trim dit input. Hvis du beder Claude Code om at gennemgå en fil, skal du udtrække det relevante afsnit — ikke give det hele 1.000-linjes filen, når kun 50 linjer betyder noget.

5. Bed ikke AI'en om at gentage eller omformatere. Kopier outputtet og omformater det selv. "Kan du omskrive det som punktopstilling?" koster det samme som det oprindelige svar plus det nye. Vælg teksten, omformater lokalt.

6. Brug Projects til vedvarende kontekst. I Claude skal du uploade din projektdokumentation, kodestandarder og præferencer til et Project én gang. Hver samtale nedarver denne kontekst uden at brænde tokens på at genforklare det.

7. Installer Caveman til outputkompression. Plugin'et Caveman open-source fjerner ordrige forklaringer fra Claude Code-svar, hvilket reducerer outputtokens med 40-60% samtidig med at kodepræcision bevares. Se vores 3 Claude Code repos-guide for opsætningsinstruktioner.

8. Overvåg med Code Burn. Du kan ikke optimere det, du ikke måler. Code Burn viser token-forbrug pr. fil, pr. samtale. Alene synligheden ændrer din adfærd.

Får du værdi af dette? Vi publicerer praktiske AI-kostbesparelsesguides hver uge. Tilslut læsere, der bygger smartere →

Matematikken, der ændrer din adfærd

Et typisk Claude Pro-abonnement giver dig cirka 45 Opus-beskeder pr. 5-timers vindue. Uden optimering brænder en kompleks kodningssession gennem dette på 90 minutter. Med disse teknikker tager det samme arbejde 30-35 beskeder — hvilket efterlader plads til resten af din dag.

Forskellen mellem "Jeg rammer altid hastighedsbegrænsninger" og "Jeg rammer sjældent hastighedsbegrænsninger" er ikke at betale for et højere niveau. Det er arbejdsgangdisciplin.

Den kontraintuitive sandhed om længere prompts

En længere, mere detaljeret prompt koster flere tokens pr. besked. Men det koster færre tokens pr. opgave, fordi det reducerer antallet af frem- og tilbage-beskeder. Vores Prompt Optimizer gør prompts længere og mere specifikke — og det er netop derfor, det sparer dig tokens i alt. En 80-ords prompt, der virker, koster mindre end fem 10-ords prompts, der ikke gør.

Den dyreste prompt, du kan skrive, er en kort, vag, der skal sendes tre gange.

Det er hvad vi gør hver uge. Et dybt dyk i AI-værktøjer, arbejdsgange og ærlige meninger — ingen hype, ingen fyld. Tilslut os →

Oplysning: Nogle links i denne artikel er affiliate-links. Vi anbefaler kun værktøjer, vi personligt har testet og bruger regelmæssigt. Se vores fulde oplysningspolitik.