Belirsiz 10 kelimelik bir prompt'un 4 tur açıklama gerektirmesi, ilk denemede işe yarayan kesin 80 kelimelik bir prompt'tan daha fazla token harcaması demektir. En pahalı yapay zeka etkileşimi uzun olan değildir — tekrarlamanız gereken olandır. İşte Claude Code, Cursor ve diğer tüm yapay zeka kodlama araçlarında token kullanımını yarıya indiren 8 teknik.

Hızlı Bilgiler
  • Temel neden: Token israfının %60'ı bağlamın yeniden açıklanmasından ve belirsiz promptların tekrarlanmasından kaynaklanır
  • En etkili yöntem: Yeni sohbetler başlatmak (tüm geçmişi yeniden okumayı kaydeder)
  • İkinci etkili yöntem: Daha iyi promptlar (bir iyi prompt 3-4 kötü prompt'u değiştirir)
  • Yardımcı araçlar: Caveman (çıktı sıkıştırması), Code Burn (kullanım izleme)
  • Uygulanabilir: Claude Code, Cursor, GitHub Copilot, Windsurf — hepsi
  • Son doğrulama: Nisan 2026

Token İsrafı Neden Oluşur?

Tüm yapay zeka kodlama araçları kapı altında aynı şekilde çalışır: prompt'unuz artı tüm sohbet geçmişi her mesajla modele gönderilir. 1. mesaj ucuzdur. 20. mesaj pahalıdır — çünkü model yanıt üretmeden önce önceki 19 mesajı yeniden okur.

Bu, en büyük token kaybının karmaşık promptlar olmadığı anlamına gelir. Uzun konuşmalardır. Her mesajın tam geçmişi yeniden okuduğu 30 mesajlık bir sohbet, aynı toplam iş için altı tane 5 mesajlık ayrı sohbetin maliyetinin kabaca 5 katıdır.

İkinci kaynak iterasyondur. "Auth ekle" → "Hayır, OAuth demek istedim" → "Google sağlayıcısıyla" → "Ve rate limiting ekle" → "Ayrıca refresh token'larını işle" beş etkileşim mal olur, oysa bir detaylı prompt bunu doğru almış olurdu: "OAuth kimlik doğrulamasını Google sağlayıcısıyla ekle, auth endpoint'lerinde rate limiting ve refresh token işleme dahil olmak üzere."

8 Teknik

1. Her 15-20 mesajda yeni sohbetler başlat. Bu tek en etkili alışkanlıktır. Mevcut ilerlemenizi 3-4 cümlede özetle, yeni sohbet başlat, özeti bağlam olarak yapıştır. Mesaj başına token maliyeti temel seviyeye düşer.

2. Prompt'ları teslim alma belgeleri gibi yaz. Neyin var olduğunu, neyi değiştirmek istediğini, nelerin dokunulmaması gerektiğini ve beklenen sonucu dahil et. Bir kesin prompt 3-4 belirsiz prompt'u değiştirir. Net token tasarrufu: %60-70.

3. Görev için doğru modeli kullan. Rutin düzenlemeler için Claude Sonnet. Karmaşık mantık için Opus. En güçlü (ve en pahalı) modeli ihtiyaç duymayan görevler için kullanma. Cursor'da varsayılan kullanmak yerine modeli manuel olarak seç.

4. Girişini kırp. Claude Code'a bir dosyayı incelemesini istiyorsan, ilgili bölümü çıkar — sadece 50 satır önemli olduğunda tüm 1.000 satırlık dosyayı beslemme.

5. Yapay zekaya tekrar etmesini veya yeniden biçimlendirmesini isteme. Çıktıyı kopyala ve kendin yeniden biçimlendir. "Bunu madde işaretleri olarak yeniden yazabilir misin?" orijinal yanıt artı yeninin maliyeti kadar mal olur. Metni seç, yerel olarak yeniden biçimlendir.

6. Kalıcı bağlam için Projeleri kullan. Claude'da proje belgeleri, kodlama standartları ve tercihlerini bir Projeye bir kez yükle. Her sohbet bu bağlamı mirasçı olarak alır, token harcamadan yeniden açıklamaya gerek olmadan.

7. Çıktı sıkıştırması için Caveman'ı yükle. Açık kaynaklı Caveman eklentisi Claude Code yanıtlarından ayrıntılı açıklamaları çıkararak, çıktı token'larını %40-60 azaltırken kod doğruluğunu korur. Kurulum talimatları için 3 Claude Code repo'su kılavuzumuza bakın.

8. Code Burn ile izle. Ölçmediğin şeyi optimize edemezsin. Code Burn dosya başına, sohbet başına token tüketimini gösterir. Görünürlük tek başına davranışını değiştirir.

Bundan değer alıyor musun? Haftada bir pratik yapay zeka maliyet tasarrufu rehberleri yayınlıyoruz. Daha akıllı inşa eden okuyucularla katıl →

Davranışını Değiştiren Matematik

Tipik bir Claude Pro aboneliği 5 saatlik bir pencerede kabaca 45 Opus mesajı sağlar. Optimizasyon olmadan, karmaşık bir kodlama oturumu bunu 90 dakikada tüketir. Bu tekniklerle aynı iş 30-35 mesaj alır — ggünün geri kalanında headroom bırakır.

"Her zaman rate limitine vurum" ile "Nadiren rate limitine vurum" arasındaki fark daha yüksek bir tier için ödeme yapmak değildir. İş akışı disiplinidir.

Daha Uzun Promptlar Hakkında Mantık Dışı Gerçek

Daha uzun, daha detaylı bir prompt mesaj başına daha fazla token mal olur. Ama görev başına daha az token mal olur çünkü geri ve ileri mesaj sayısını azaltır. Prompt Optimizer'ımız prompt'ları daha uzun ve spesifik hale getirir — ve bu tam olarak seni genel olarak token'dan tasarruf etmesinin nedenidir. İşe yarayan bir 80 kelimelik prompt, işe yaramayan beş 10 kelimelik prompt'tan daha az mal olur.

Yazabileceğin en pahalı prompt kısa, belirsiz bir prompt'tur ve üç kez gönderilmesi gerekir.

Bu, her hafta yaptığımız şeydir. Yapay zeka araçları, iş akışları ve dürüst görüşler hakkında bir derinlemesine inceleme — hype yok, dolgu yok. Bize katıl →

Açıklama: Bu makaledeki bazı bağlantılar afiliasyon bağlantılarıdır. Sadece kişisel olarak test ettiğimiz ve düzenli kullandığımız araçları öneriz. Tam açıklama politikamıza bakın.