曖昧な10語のプロンプトで4ラウンドの説明が必要な場合、1回で完璧に機能する正確な80語のプロンプトよりも多くのトークンがかかります。最も費用がかかるAIとの対話は長いものではなく、繰り返す必要があるものです。Claude Code、Cursor、その他すべてのAIコーディングツールでトークン使用量を半減させる8つのテクニックをご紹介します。
- 根本原因: トークン無駄の60%は、コンテキストの再説明と曖昧なプロンプトの反復から発生します
- 最大の改善策: 新しい会話を開始する(会話履歴全体の再読を回避)
- 次の改善策: より良いプロンプト(1つの良いプロンプトが3~4つの悪いプロンプトに代わる)
- 役立つツール: Caveman(出力圧縮)、Code Burn(使用状況監視)
- 対象: Claude Code、Cursor、GitHub Copilot、Windsurf — すべてに適用可能
- 最後の確認: 2026年4月
トークン無駄が発生する理由
すべてのAIコーディングツールは内部では同じ方法で動作します。プロンプトと会話履歴全体が、メッセージごとにモデルに送信されます。メッセージ1は安価です。メッセージ20は高額です。モデルが応答を生成する前に、前の19メッセージをすべて再読する必要があるためです。
これは、最大のトークン消費が複雑なプロンプトではなく、長い会話であることを意味します。各メッセージが履歴全体を再読する30メッセージの会話は、同じ総作業量の6つの5メッセージ会話にかかる費用のおよそ5倍です。
2番目の消費は反復です。「認証を追加」→「いや、OAuth認証で」→「Googleプロバイダーで」→「レート制限も追加」→「リフレッシュトークンも処理」は5つの対話が必要ですが、1つの詳細なプロンプトであれば正しく実行できます。「Googleプロバイダーを使用したOAuth認証を追加し、認証エンドポイントでのレート制限とリフレッシュトークン処理を含める。」
8つのテクニック
1. 15~20メッセージごとに新しい会話を開始します。 これは最も効果的な習慣です。現在の進捗を3~4文で要約し、新しいチャットを開始し、要約をコンテキストとして貼り付けます。メッセージごとのトークンコストがベースラインに戻ります。
2. プロンプトを引き継ぎドキュメントのように書きます。 既存内容、変更したい内容、触れてはいけない内容、期待される結果を含めます。1つの正確なプロンプトが3~4つの曖昧なプロンプトに代わります。トークン節約率: 60~70%。
3. タスクに適したモデルを使用します。 通常の編集はClaude Sonnet。複雑な推論はOpus。最も強力な(そして最も高価な)モデルが必要ないタスクに使用しないでください。Cursorではデフォルトを使用する代わりに手動でモデルを選択します。
4. 入力を削減します。 Claude Codeにファイルのレビューを依頼する場合、関連セクションを抽出してください。50行だけが重要な場合、1,000行全体を与えないでください。
5. AIに繰り返しや再フォーマットを要求しません。 出力をコピーして自分で再フォーマットしてください。「これを箇条書きで書き直してくれませんか?」は元の応答と新しい応答の費用がかかります。テキストを選択して、ローカルで再フォーマットしてください。
6. 永続的なコンテキストについてProjectsを使用します。 Claudeで、プロジェクトドキュメント、コーディング標準、環境設定をProjectにアップロードしてください。すべての会話がトークンを消費することなくこのコンテキストを継承します。
7. 出力圧縮にCavemanをインストールします。 オープンソースのCavemanプラグインはClaude Code応答から冗長な説明を削除し、出力トークンを40~60%削減しながらコードの精度を保ちます。セットアップ手順については、3 Claude Codeリポジトリガイドを参照してください。
8. Code Burnで監視します。 測定できないものは最適化できません。Code Burnはファイルごと、会話ごとのトークン消費量を表示します。可視性だけで行動が変わります。
価値を感じていますか? 実用的なAIコスト削減ガイドを毎週公開しています。スマートに構築する読者に参加 →
行動を変える数学
典型的なClaude Pro購読では、5時間のウィンドウあたりおよそ45のOpusメッセージが提供されます。最適化なしでは、複雑なコーディングセッションは90分でこれを消費します。これらのテクニックを使用すると、同じ作業に30~35メッセージかかり、残りの日中に余裕が生まれます。
「いつもレート制限に達する」と「ほとんどレート制限に達しない」の違いは、より高いティアに支払うことではありません。それはワークフローの規律です。
より長いプロンプトについての直感に反した真実
より長く詳細なプロンプトはメッセージごとにより多くのトークンがかかります。ただし、メッセージのやり取りの数を減らすため、タスクごとのトークンがより少なくかかります。Prompt Optimizerはプロンプトをより長く、より具体的にしています。そしてそれはまさになぜ全体的にトークンを節約するかです。機能する80語のプロンプト1つは、機能しない10語のプロンプト5つより費用がかかりません。
書くことができる最も高価なプロンプトは、短く曖昧で3回送信する必要があるものです。
これは私たちが毎週行うことです。 AIツール、ワークフロー、正直な見解に関する1つの深い掘り下げ — ハイプなし、余計なし。参加する →
開示: この記事の一部のリンクはアフィリエイトリンクです。個人的にテストして定期的に使用しているツールのみを推奨しています。完全な開示ポリシーをご覧ください。