What is effort control in Claude Opus 4.8?

Effort control is a new setting (next to the model selector on claude.ai and Cowork, and as xhigh/max in Claude Code) that lets you choose how much Claude thinks before responding. Higher effort means deeper reasoning and better answers but more tokens and time. Lower effort means faster responses that conserve your rate limits. It's available on all plans.

What's the difference between extra and max effort?

Both spend more tokens than the default for better results. "Extra" (xhigh in Claude Code) is recommended for difficult tasks and long-running asynchronous workflows — a strong step up without going to the maximum. "Max" spends the most tokens and is reserved for the hardest problems where you want maximum quality regardless of cost. For most hard tasks, extra is sufficient; max is for the genuinely difficult cases.

Does higher effort cost more?

Higher effort uses more tokens, which means higher cost per response and faster rate-limit consumption. However, Opus 4.8's default high effort spends similar tokens to Opus 4.7's default on coding tasks while delivering better results, so the default isn't more expensive than before. Anthropic raised Claude Code rate limits to accommodate higher effort levels.

Which effort level should I use by default?

Leave it on the default (high) for most work — it's tuned to be the best balance for the majority of tasks. Only bump it up for genuinely difficult problems or long-running work, and only drop it down for simple, high-volume tasks where you want speed and rate-limit conservation.

Is effort control available on all plans?

Yes — Anthropic made the effort control available on all plans for claude.ai and Cowork. In Claude Code, the equivalent settings are xhigh and max. This is one of the few Opus 4.8 launch features available across all tiers (unlike dynamic workflows, which is limited to Max, Team, and Enterprise). Disclosure: Some links in this article are affiliate links. We only recommend tools we've personally tested and use regularly. See our full disclosure policy.

Cách sử dụng Điều khiển Nỗ lực Mới của Claude Opus 4.8 (Giải thích Extra và Max)

Một thanh trượt mới cho phép bạn quyết định mức độ suy nghĩ của Claude. Chọn sai và bạn sẽ lãng phí token hoặc nhận được câu trả lời hời hợt. Đây là hướng dẫn.

Một trong ba tính năng ra mắt cùng Claude Opus 4.8 là kiểm soát nỗ lực — một cài đặt mới trên claude.ai và Cowork (và xhigh/max trong Claude Code) cho phép bạn quyết định mức độ nỗ lực mà Claude bỏ ra cho một phản hồi. Nó nằm ngay cạnh bộ chọn mô hình và khả dụng trên tất cả các gói. Ở các cài đặt nỗ lực cao hơn, Claude suy nghĩ thường xuyên và sâu sắc hơn để đưa ra phản hồi tốt hơn. Ở các cài đặt nỗ lực thấp hơn, Claude phản hồi nhanh hơn và sử dụng giới hạn tốc độ của bạn chậm hơn. Đây là một điều khiển đơn giản nhưng mang lại hậu quả thực sự về chất lượng, tốc độ và chi phí — và hầu hết người dùng sẽ không biết nên chọn cài đặt nào.

Hướng dẫn này giải thích chính xác thời điểm sử dụng từng mức nỗ lực, nó ảnh hưởng đến việc sử dụng token và giới hạn tốc độ của bạn như thế nào, và những tác vụ nào xứng đáng để chi tiêu nhiều nỗ lực hơn so với những tác vụ nào ổn ở mức mặc định. Nắm được điều này, bạn sẽ nhận được kết quả tốt hơn đáng kể cho các vấn đề khó trong khi vẫn tiết kiệm được lượng sử dụng cho những vấn đề dễ.

Điểm mấu chốt

Opus 4.8 mặc định ở mức nỗ lực "high" — sự cân bằng tốt nhất giữa chất lượng và trải nghiệm, tiêu tốn lượng token tương tự như mặc định của Opus 4.7 nhưng mang lại kết quả tốt hơn. Sử dụng "extra" (xhigh trong Claude Code) cho các tác vụ khó và quy trình làm việc bất đồng bộ chạy dài. Sử dụng "max" cho các vấn đề khó nhất mà bạn muốn chất lượng tối đa bất kể chi phí token. Nỗ lực thấp hơn phản hồi nhanh hơn và bảo toàn giới hạn tốc độ cho các tác vụ đơn giản. Nỗ lực cao hơn sử dụng nhiều token hơn, vì vậy Anthropic đã tăng giới hạn tốc độ của Claude Code để đáp ứng điều này.

Kiểm Soát Nỗ Lực Thực Sự Làm Gì

Kiểm soát nỗ lực điều chỉnh mức độ "suy nghĩ" mà Claude thực hiện trước và trong khi phản hồi. Ở mức nỗ lực cao hơn, Claude lập luận thường xuyên và sâu sắc hơn — khám phá nhiều khía cạnh của vấn đề hơn, xem xét nhiều góc độ hơn và tự kiểm tra công việc của mình kỹ lưỡng hơn. Điều này tạo ra câu trả lời tốt hơn cho các tác vụ phức tạp nhưng tiêu tốn nhiều token và thời gian hơn. Ở mức nỗ lực thấp hơn, Claude phản hồi trực tiếp và nhanh chóng hơn, lý tưởng cho các tác vụ đơn giản mà việc lập luận sâu sẽ là quá mức cần thiết và chỉ gây lãng phí token và giới hạn tốc độ.

Opus 4.8 mặc định ở mức nỗ lực "high", mà Anthropic đánh giá là sự cân bằng tổng thể tốt nhất giữa chất lượng và trải nghiệm người dùng. Điều quan trọng là, đối với các tác vụ lập trình, mức nỗ lực cao mặc định này tiêu tốn lượng token tương tự như mặc định của Opus 4.7 — nhưng mang lại hiệu suất tốt hơn. Vì vậy, mặc định không đắt hơn những gì bạn đã sử dụng; nó chỉ tốt hơn. Trên mức mặc định, bạn có "extra" (được gọi là xhigh trong Claude Code) và "max", tiêu tốn dần nhiều token hơn để đạt được kết quả tốt hơn cho các vấn đề khó.

Khi Nào Sử Dụng Từng Mức Nỗ Lực

Mặc định (high): Để nguyên ở đây cho hầu hết công việc. Đây là cài đặt cân bằng xử lý tốt phần lớn các tác vụ — câu hỏi chung, lập trình tiêu chuẩn, viết lách, phân tích và sử dụng hàng ngày. Bạn không cần phải chạm vào điều khiển cho công việc thường ngày; mặc định được tinh chỉnh để là lựa chọn phù hợp trong hầu hết thời gian.

Extra (xhigh trong Claude Code): Anthropic đặc biệt khuyến nghị mức này cho các tác vụ khó và quy trình làm việc bất đồng bộ chạy dài. Nếu bạn giao cho Claude một vấn đề lập trình phức tạp, một phân tích nhiều bước hoặc một tác vụ tự động sẽ chạy không cần giám sát trong một thời gian, hãy tăng lên extra. Việc suy nghĩ bổ sung sẽ được đền đáp cho các vấn đề mà câu trả lời đầu tiên không có khả năng là câu trả lời tốt nhất. Đây là cài đặt cho "việc này khó và tôi muốn nó được làm đúng."

Max: Dành riêng cho các vấn đề khó nhất mà chất lượng quan trọng hơn chi phí token — các quyết định kiến trúc phức tạp, gỡ lỗi phức tạp, phân tích rủi ro cao, hoặc bất kỳ tác vụ nào mà bạn thà chi tiêu nhiều token hơn là mạo hiểm với một câu trả lời không tối ưu. Nỗ lực tối đa sử dụng nhiều token nhất, vì vậy đây không phải là cài đặt cho công việc thường ngày, nhưng đối với các vấn đề thực sự khó, nó khai thác tối đa từ mô hình.

Nỗ lực thấp hơn: Giảm xuống dưới mặc định cho các tác vụ đơn giản, khối lượng lớn, nơi tốc độ và bảo toàn giới hạn tốc độ quan trọng hơn chiều sâu — tra cứu nhanh, viết lại đơn giản, định dạng thường lệ, hoặc khi bạn đang xử lý nhiều tác vụ nhỏ và muốn bảo toàn lượng sử dụng của mình. Nỗ lực thấp hơn phản hồi nhanh hơn và sử dụng giới hạn tốc độ của bạn chậm hơn.

📬 Thấy nội dung này hữu ích?

Một thông tin chi tiết hữu ích về AI mỗi tuần. Kèm theo gói prompt miễn phí khi bạn đăng ký.

Đăng ký miễn phí →

Tham Khảo Nhanh Mức Nỗ Lực

Mức Nỗ Lực	Phù Hợp Nhất Cho	Sử Dụng Token
Thấp hơn	Tác vụ đơn giản, khối lượng lớn; tra cứu nhanh	Thấp nhất
Cao (mặc định)	Hầu hết tác vụ hàng ngày — cân bằng	Trung bình
Extra (xhigh)	Tác vụ khó, công việc bất đồng bộ chạy dài	Cao
Tối đa	Vấn đề khó nhất, chất lượng hơn chi phí	Cao nhất

Một lưu ý thực tế: mức nỗ lực và chất lượng prompt phối hợp với nhau. Cài đặt nỗ lực cao không thể bù đắp hoàn toàn cho một prompt mơ hồ, và một prompt tuyệt vời ở mức nỗ lực mặc định thường đánh bại một prompt tầm thường ở mức nỗ lực tối đa. Prompt Optimizer miễn phí làm sắc nét prompt của bạn để bạn có được kết quả tốt nhất ở bất kỳ mức nỗ lực nào bạn chọn, và TresPrompt mang sự tối ưu hóa đó vào thanh bên Claude của bạn. Để có bức tranh toàn cảnh về những gì mới trong bản phát hành này, hãy xem tổng quan Opus 4.8 của chúng tôi.

📬 Muốn nhận thêm nội dung như thế này?

Một thông tin chi tiết hữu ích về AI mỗi tuần. Kèm theo gói prompt miễn phí khi bạn đăng ký.

Đăng ký miễn phí →

Kiểm Soát Nỗ Lực vs Chất Lượng Prompt: Điều Gì Quan Trọng Hơn?

Một quan niệm sai lầm phổ biến là việc vặn nỗ lực lên tối đa có thể thay thế cho việc viết một prompt tốt. Điều này không đúng. Kiểm soát nỗ lực điều chỉnh mức độ suy nghĩ của mô hình, nhưng nó không thể bù đắp cho các hướng dẫn mơ hồ, không rõ ràng hoặc thiếu ngữ cảnh chính. Nếu bạn hỏi một câu hỏi được chỉ định kém ở mức nỗ lực tối đa, bạn sẽ nhận được một câu trả lời được lập luận kỹ lưỡng cho câu hỏi sai. Mô hình sẽ suy nghĩ kỹ — về điều sai. Nỗ lực và chất lượng prompt bổ sung cho nhau, không thể thay thế: chất lượng prompt xác định liệu mô hình có hiểu bạn muốn gì không, trong khi nỗ lực xác định mức độ triệt để mà nó theo đuổi điều đó.

Trong thực tế, động thái mang lại hiệu quả cao nhất thường là cải thiện prompt trước khi chạm vào kiểm soát nỗ lực. Một prompt rõ ràng, cụ thể, có cấu trúc tốt ở mức nỗ lực mặc định thường xuyên đánh bại một prompt mơ hồ ở mức nỗ lực tối đa — và tiêu tốn ít token hơn nhiều. Chỉ sau khi bạn đã hoàn thiện prompt, việc tăng mức nỗ lực mới được đền đáp, bằng cách cho mô hình không gian để xử lý triệt để một vấn đề đã được hiểu rõ. Hãy nghĩ về nó như một trình tự: đầu tiên đảm bảo mô hình biết chính xác bạn muốn gì (chất lượng prompt), sau đó quyết định nó nên làm việc chăm chỉ đến mức nào (mức nỗ lực).

Kiểm Soát Nỗ Lực trong Quy Trình Làm Việc Chạy Dài và Bất Đồng Bộ

Kiểm soát nỗ lực trở nên đặc biệt có giá trị trong các quy trình làm việc chạy dài và bất đồng bộ, đây chính xác là nơi Anthropic khuyến nghị cài đặt "extra". Khi bạn giao cho Claude một tác vụ sẽ chạy không cần giám sát — một quy trình tự động, một phân tích nhiều bước phức tạp, một tác vụ lập trình dài — bạn không ngồi đó chờ đợi từng token, vì vậy hình phạt tốc độ của nỗ lực cao hơn không ảnh hưởng đến trải nghiệm của bạn. Trong khi đó, lợi ích chất lượng được khuếch đại vì tác vụ đủ phức tạp để việc lập luận kỹ lưỡng cải thiện đáng kể kết quả. Công việc bất đồng bộ là trường hợp lý tưởng cho nỗ lực cao hơn: bạn nhận được lợi ích chất lượng mà không cảm thấy chi phí tốc độ.

Điều ngược lại áp dụng cho công việc tương tác, thời gian thực. Khi bạn đang trong một cuộc trò chuyện qua lại lặp lại nhanh chóng, nỗ lực thấp hơn hoặc mặc định giữ cho trải nghiệm nhanh nhạy, và bạn luôn có thể tăng nỗ lực cho một câu hỏi khó duy nhất ở giữa một phiên làm việc đơn giản. Kỹ năng nằm ở việc kết hợp nỗ lực với mô hình tương tác: nỗ lực cao cho công việc phức tạp không cần giám sát, mặc định cho công việc tương tác, thấp hơn cho các lần lặp đơn giản nhanh chóng. Kết hợp với việc chọn bậc mô hình phù hợp, điều này cung cấp cho bạn quyền kiểm soát chi tiết đối với sự đánh đổi chất lượng-tốc độ-chi phí cho mọi tác vụ.

Câu Hỏi Thường Gặp

Kiểm soát nỗ lực trong Claude Opus 4.8 là gì?

Kiểm soát nỗ lực là một cài đặt mới (bên cạnh bộ chọn mô hình trên claude.ai và Cowork, và dưới dạng xhigh/max trong Claude Code) cho phép bạn chọn mức độ suy nghĩ của Claude trước khi phản hồi. Nỗ lực cao hơn có nghĩa là lập luận sâu hơn và câu trả lời tốt hơn nhưng tốn nhiều token và thời gian hơn. Nỗ lực thấp hơn có nghĩa là phản hồi nhanh hơn, bảo toàn giới hạn tốc độ của bạn. Nó khả dụng trên tất cả các gói.

Sự khác biệt giữa nỗ lực extra và max là gì?

Cả hai đều tiêu tốn nhiều token hơn mặc định để có kết quả tốt hơn. "Extra" (xhigh trong Claude Code) được khuyến nghị cho các tác vụ khó và quy trình làm việc bất đồng bộ chạy dài — một bước tăng mạnh mẽ mà không lên đến mức tối đa. "Max" tiêu tốn nhiều token nhất và được dành riêng cho các vấn đề khó nhất mà bạn muốn chất lượng tối đa bất kể chi phí. Đối với hầu hết các tác vụ khó, extra là đủ; max dành cho các trường hợp thực sự khó khăn.

Nỗ lực cao hơn có tốn kém hơn không?

Nỗ lực cao hơn sử dụng nhiều token hơn, có nghĩa là chi phí mỗi phản hồi cao hơn và tiêu thụ giới hạn tốc độ nhanh hơn. Tuy nhiên, mức nỗ lực cao mặc định của Opus 4.8 tiêu tốn token tương tự như mặc định của Opus 4.7 đối với các tác vụ lập trình trong khi mang lại kết quả tốt hơn, vì vậy mặc định không đắt hơn trước đây. Anthropic đã tăng giới hạn tốc độ của Claude Code để đáp ứng các mức nỗ lực cao hơn.

Tôi nên sử dụng mức nỗ lực nào theo mặc định?

Để nguyên ở mức mặc định (cao) cho hầu hết công việc — nó được tinh chỉnh để là sự cân bằng tốt nhất cho phần lớn các tác vụ. Chỉ tăng nó lên cho các vấn đề thực sự khó hoặc công việc chạy dài, và chỉ giảm nó xuống cho các tác vụ đơn giản, khối lượng lớn, nơi bạn muốn tốc độ và bảo toàn giới hạn tốc độ.

Kiểm soát nỗ lực có khả dụng trên tất cả các gói không?

Có — Anthropic đã làm cho kiểm soát nỗ lực khả dụng trên tất cả các gói cho claude.ai và Cowork. Trong Claude Code, các cài đặt tương đương là xhigh và max. Đây là một trong số ít các tính năng ra mắt của Opus 4.8 khả dụng trên tất cả các bậc (không giống như quy trình làm việc động, bị giới hạn ở các gói Max, Team và Enterprise).

Tiết lộ: Một số liên kết trong bài viết này là liên kết liên kết. Chúng tôi chỉ giới thiệu các công cụ mà chúng tôi đã cá nhân kiểm tra và sử dụng thường xuyên. Xem chính sách tiết lộ đầy đủ của chúng tôi.