曖昧な10語のプロンプトが4ラウンドの明確化を必要とする場合、初回で機能する正確な80語のプロンプトよりも多くのトークンがかかります。最も高額なAI操作は長いものではなく、繰り返す必要があるものです。Claude Code、Cursor、その他すべてのAIコーディングツール全体でトークン使用量を半減させる8つのテクニックを紹介します。
- 根本原因: トークン浪費の60%はコンテキストの再説明と曖昧なプロンプトの反復から生じます
- 最大の効果: 新しい会話を開始する(履歴全体の再読み込みを回避)
- 次の効果: より良いプロンプト(1つの良いプロンプトが3~4つの悪いプロンプトに置き換わる)
- 役立つツール: Caveman(出力圧縮)、Code Burn(使用量監視)
- 対象: Claude Code、Cursor、GitHub Copilot、Windsurf — すべて対応
- 最終確認: 2026年4月
トークン浪費が発生する理由
すべてのAIコーディングツールは内部的に同じ方法で動作します。プロンプトと会話履歴全体がメッセージごとにモデルに送信されます。メッセージ1は安いです。メッセージ20は高額です。モデルが応答を生成する前に、以前の19件のメッセージをすべて再読み込みするためです。
つまり、最大のトークン消費は複雑なプロンプトではなく、長い会話です。各メッセージが履歴全体を再読み込みする30メッセージの会話は、同じ総作業量で6つの5メッセージの個別の会話にかかる費用の約5倍です。
2番目の消費は反復です。「認証を追加」→「いや、OAuth を使いたい」→「Google プロバイダーで」→「レート制限も追加」→「トークンの更新処理も含める」という5つの操作は、詳細な1つのプロンプトで正しく得られるはずです。「Google プロバイダーを使用した OAuth 認証を追加し、認証エンドポイントのレート制限とリフレッシュトークン処理を含める」
8つのテクニック
1. 15~20メッセージごとに新しい会話を開始する。 これは最も影響力のある習慣です。現在の進捗を3~4文で要約し、新しいチャットを開始して、要約をコンテキストとして貼り付けます。メッセージあたりのトークンコストがベースラインに戻ります。
2. 引き継ぎドキュメントのようにプロンプトを書く。 何が存在するか、何を変更したいか、何を触れるべきではないか、期待される結果を含めます。1つの正確なプロンプトが3~4つの曖昧なプロンプトに置き換わります。トークン節約率:60~70%。
3. タスクに適したモデルを使用する。 日常的な編集にはClaude Sonnet。複雑な推論にはOpus。タスクが不要な最も強力で高額なモデルを使用しないでください。Cursorではデフォルトを使用せずに手動でモデルを選択してください。
4. 入力を削減する。 Claude Codeにファイルをレビューさせる場合は、関連セクションを抽出します。1000行のファイル全体をフィードしないでください(50行だけが重要な場合)。
5. AIに繰り返しまたは再フォーマットさせない。 出力をコピーして自分でリフォーマットします。「それを箇条書きで書き直してもらえますか?」は、元の応答と新しい応答の両方のコストがかかります。テキストを選択してローカルでリフォーマットします。
6. 永続的なコンテキストについてはプロジェクトを使用する。 Claudeでプロジェクトドキュメント、コーディング標準、環境設定をプロジェクトに1回アップロードします。すべての会話はトークンを消費して再説明することなく、このコンテキストを継承します。
7. 出力圧縮用にCavemanをインストール。 オープンソースのCavemanプラグインはClaude Codeのレスポンスから詳細な説明を削除し、出力トークンを40~60%削減しながらコード精度を維持します。セットアップ手順については、3つのClaude Codeリポジトリガイドを参照してください。
8. Code Burnで監視する。 測定しないものは最適化できません。Code Burnはファイルごと、会話ごとのトークン消費を表示します。可視化だけでも行動が変わります。
価値を感じていますか? 週単位で実践的なAIコスト削減ガイドを公開しています。より賢くビルドするリーダーに参加 →
行動を変える数学
標準的なClaude Proサブスクリプションは、5時間のウィンドウで約45件のOpusメッセージを提供します。最適化なしでは、複雑なコーディングセッションはこれを90分で消費します。これらのテクニックを使用すると、同じ作業は30~35メッセージかかり、残りの日の余裕が残ります。
「常にレート制限に達する」と「レート制限に達することはめったにない」の違いは、より高いティアに支払うことではありません。ワークフローの規律です。
より長いプロンプトについての直感に反する真実
より長く、より詳細なプロンプトはメッセージあたりのトークンコストが高くなります。ただし、やり取りメッセージの数を減らすため、タスクあたりのトークンコストは低くなります。Prompt Optimizerはプロンプトをより長く、より具体的にします。これはまさに全体的にトークンを節約する理由です。機能する80語の1つのプロンプトが、機能しない10語の5つのプロンプトより安いです。
書くことができる最も高額なプロンプトは、短く曖昧な3回送信する必要があるものです。
これは毎週やっていることです。 AIツール、ワークフロー、正直な意見に関する1つの詳細な深掘り — ハイプなし、フィラーなし。参加する →
開示:この記事のリンクの一部はアフィリエイトリンクです。個人的にテストし、定期的に使用するツールのみを推奨しています。完全な開示ポリシーを参照してください。