모호한 10단어 프롬프트는 4번의 명확화 과정이 필요하고, 정확한 80단어 프롬프트는 한 번에 작동합니다. 첫 번째가 두 번째보다 더 많은 토큰을 소비합니다. 가장 비용이 많이 드는 AI 상호작용은 긴 것이 아니라 반복해야 하는 것입니다. Claude Code, Cursor 및 다른 모든 AI 코딩 도구에서 토큰 사용을 절반으로 줄이는 8가지 기법을 소개합니다.
- 근본 원인: 토큰 낭비의 60%는 문맥을 다시 설명하고 모호한 프롬프트에 대해 반복하는 데서 발생합니다
- 가장 효과적인 방법: 새로운 대화 시작 (전체 기록 다시 읽기 절약)
- 두 번째 효과적인 방법: 더 나은 프롬프트 (좋은 프롬프트 1개가 나쁜 프롬프트 3-4개를 대체)
- 도움이 되는 도구: Caveman (출력 압축), Code Burn (사용량 모니터링)
- 적용 대상: Claude Code, Cursor, GitHub Copilot, Windsurf — 모두 해당
- 마지막 확인: 2026년 4월
토큰 낭비가 발생하는 이유
모든 AI 코딩 도구는 내부적으로 같은 방식으로 작동합니다. 각 메시지마다 프롬프트와 전체 대화 기록이 모델로 전송됩니다. 첫 번째 메시지는 저렴합니다. 20번째 메시지는 비쌉니다. 모델이 응답을 생성하기 전에 이전 19개 메시지를 모두 다시 읽기 때문입니다.
따라서 가장 큰 토큰 소비는 복잡한 프롬프트가 아니라 긴 대화입니다. 각 메시지가 전체 기록을 다시 읽는 30개 메시지 대화는 동일한 작업을 위한 6개의 별도 5개 메시지 대화보다 대략 5배 비쌉니다.
두 번째 소비 원인은 반복입니다. "인증 추가" → "아니, OAuth를 의미했어" → "Google 제공자로" → "그리고 속도 제한 추가" → "또한 새로고침 토큰 처리" 는 5번의 상호작용이 필요하지만, 한 번의 상세한 프롬프트는 올바르게 처리했을 것입니다: "Google 제공자로 OAuth 인증을 추가하고, 인증 엔드포인트에 대한 속도 제한 및 새로고침 토큰 처리를 포함하세요."
8가지 기법
1. 15-20개 메시지마다 새로운 대화를 시작하세요. 이것이 가장 영향력 있는 습관입니다. 현재 진행 상황을 3-4문장으로 요약하고, 새로운 채팅을 시작한 다음, 요약을 문맥으로 붙여넣으세요. 메시지당 토큰 비용이 기본선으로 떨어집니다.
2. 인수인계 문서처럼 프롬프트를 작성하세요. 무엇이 존재하는지, 무엇을 변경하고 싶은지, 건드려서는 안 될 부분, 예상 결과를 포함하세요. 정확한 프롬프트 1개가 모호한 프롬프트 3-4개를 대체합니다. 순 토큰 절약: 60-70%.
3. 작업에 적합한 모델을 사용하세요. 일상적인 편집에는 Claude Sonnet을 사용하세요. 복잡한 추론에는 Opus를 사용하세요. 필요 없는 작업에 가장 강력한 (그리고 가장 비싼) 모델을 사용하지 마세요. Cursor에서는 기본값을 사용하는 대신 수동으로 모델을 선택하세요.
4. 입력을 줄이세요. Claude Code에 파일을 검토하도록 요청하는 경우, 전체 1,000줄 파일을 공급하지 말고 관련 섹션만 추출하세요. 50줄만 중요한 경우가 많습니다.
5. AI에 반복하거나 재형식하도록 요청하지 마세요. 출력을 복사하고 직접 재형식하세요. "그것을 글머리 기호로 다시 쓸 수 있나요?"는 원래 응답과 새로운 응답의 비용이 동일합니다. 텍스트를 선택하고 로컬에서 재형식하세요.
6. 지속적인 문맥을 위해 Projects를 사용하세요. Claude에서 프로젝트 문서, 코딩 표준, 및 선호도를 한 번에 Project에 업로드하세요. 모든 대화가 토큰을 소비하지 않고 이 문맥을 상속합니다.
7. 출력 압축을 위해 Caveman을 설치하세요. 오픈소스 Caveman 플러그인은 Claude Code 응답에서 장황한 설명을 제거하여 출력 토큰을 40-60% 줄이면서 코드 정확도를 유지합니다. 설정 지침은 우리의 3가지 Claude Code repos 가이드를 참조하세요.
8. Code Burn으로 모니터링하세요. 측정하지 않는 것은 최적화할 수 없습니다. Code Burn은 파일당, 대화당 토큰 소비를 보여줍니다. 이러한 가시성만으로도 행동이 바뀝니다.
이 내용이 유용했나요? 우리는 매주 실용적인 AI 비용 절감 가이드를 발행합니다. 더 똑똑하게 구축하는 독자들과 함께하세요 →
행동을 바꾸는 수학
일반적인 Claude Pro 구독은 5시간 창에서 대략 45개의 Opus 메시지를 제공합니다. 최적화 없이 복잡한 코딩 세션은 90분 안에 이를 소진합니다. 이러한 기법을 사용하면 동일한 작업이 30-35개 메시지를 사용하여 하루의 나머지 시간을 위한 여유를 남깁니다.
"항상 속도 제한에 도달한다"와 "거의 속도 제한에 도달하지 않는다" 사이의 차이는 더 높은 등급을 지불하는 것이 아닙니다. 워크플로우 규율입니다.
더 긴 프롬프트에 대한 직관에 어긋나는 진실
더 길고 상세한 프롬프트는 메시지당 더 많은 토큰을 비용으로 요구합니다. 하지만 메시지 왕복 수를 줄이기 때문에 작업당 더 적은 토큰을 비용으로 요구합니다. 우리의 Prompt Optimizer는 프롬프트를 더 길고 구체적으로 만듭니다. 그리고 그것이 정확히 전체적으로 토큰을 절약하는 이유입니다. 한 번에 작동하는 80단어 프롬프트는 작동하지 않는 10단어 프롬프트 5개보다 비용이 적습니다.
작성할 수 있는 가장 비싼 프롬프트는 3번 보내야 하는 짧고 모호한 것입니다.
이것이 우리가 매주 하는 일입니다. AI 도구, 워크플로우, 정직한 의견에 대한 깊이 있는 분석 — 과장 없음, 채우기 없음. 우리와 함께하세요 →
공개: 이 글의 일부 링크는 제휴 링크입니다. 우리는 개인적으로 테스트하고 정기적으로 사용하는 도구만 권장합니다. 우리의 전체 공개 정책을 참조하세요.