What changed in the Claude Messages API with Opus 4.8?

The Messages API now accepts system entries inside the messages array. This lets developers update Claude's instructions mid-task — without breaking the prompt cache or routing the update through a user turn. Previously you had to either re-send the full system prompt (breaking the cache) or inject updates as user messages (polluting the conversation).

Why does mid-task system prompt updating matter?

Agents are long-running processes where context legitimately changes mid-task — permissions, token budgets, environment context. The new system entries let you update Claude's instructions at the moment they change, cleanly and efficiently. It saves tokens, reduces latency (cache stays intact), and keeps conversation state clean.

Does updating system entries break the prompt cache?

No — that's the key benefit. The new system entries let you update instructions without breaking the prompt cache, avoiding the expensive recomputation and added latency that came from re-sending the full system prompt. The cache stays intact while the instructions update.

What are common use cases for mid-task system entries?

Anthropic cites updating permissions (e.g., an agent earning write access mid-task), adjusting token budgets based on progress, and injecting new environment context (config changes, new constraints) as an agent runs. Any scenario where an agent's operating parameters need to change during execution benefits from this.

Is this feature specific to Opus 4.8?

The Messages API system entries capability launched alongside Opus 4.8 as part of the same release. It's an API-level feature for developers building on Claude. Check Anthropic's API documentation for the exact implementation syntax and which models support it. Disclosure: Some links in this article are affiliate links. We only recommend tools we've personally tested and use regularly. See our full disclosure policy.

API Tin Nhắn Vừa Thay Đổi: Lời Nhắc Hệ Thống Giữa Tác Vụ Trong Opus 4.8 (Tại Sao Lập Trình Viên Quan Tâm)

Giờ đây bạn có thể cập nhật chỉ dẫn cho Claude giữa cuộc trò chuyện mà không làm hỏng bộ nhớ đệm lời nhắc. Đối với những người xây dựng tác nhân, đây là một thay đổi âm thầm nhưng mang tính đột phá.

Trong số ba tính năng được ra mắt cùng Claude Opus 4.8, có một tính năng ít được chú ý nhất nhưng lại cực kỳ quan trọng đối với các nhà phát triển đang xây dựng agent: Messages API hiện chấp nhận các mục hệ thống bên trong mảng tin nhắn. Nói một cách đơn giản, giờ đây bạn có thể cập nhật hướng dẫn cho Claude giữa chừng tác vụ — mà không làm hỏng bộ nhớ đệm prompt và không cần định tuyến bản cập nhật qua một lượt người dùng. Đối với bất kỳ ai đang xây dựng ứng dụng agent, điều này giải quyết một điểm đau thực sự và dai dẳng.

Nếu bạn đã từng xây dựng agent trên Claude API, bạn sẽ biết vấn đề mà điều này giải quyết. Trước đây, việc cập nhật hướng dẫn hệ thống giữa cuộc hội thoại đồng nghĩa với việc hoặc làm hỏng bộ nhớ đệm prompt (tốn kém và chậm chạp) hoặc tiêm bản cập nhật một cách vụng về dưới dạng tin nhắn người dùng (làm ô nhiễm cuộc hội thoại và gây nhầm lẫn cho mô hình). Các mục hệ thống mới đã thay đổi điều đó. Đây là một thay đổi API nhỏ nhưng có tác động vượt trội đến cách bạn kiến trúc agent.

Điểm Cốt Lõi

Claude Messages API hiện chấp nhận các mục hệ thống bên trong mảng tin nhắn, cho phép nhà phát triển cập nhật hướng dẫn cho Claude giữa chừng tác vụ mà không làm hỏng bộ nhớ đệm prompt hay phải định tuyến qua một lượt người dùng. Điều này quan trọng đối với các agent cần cập nhật quyền, ngân sách token hoặc ngữ cảnh môi trường khi đang chạy. Nó tiết kiệm token (không cần gửi lại toàn bộ system prompt), giảm độ trễ (bộ nhớ đệm vẫn nguyên vẹn) và giữ cho cuộc hội thoại sạch sẽ (không có tin nhắn người dùng giả mạo).

Điều Gì Đã Thay Đổi và Tại Sao Lại Khó Khăn Nếu Không Có Nó

Trong mô hình Messages API tiêu chuẩn, system prompt được thiết lập một lần khi bắt đầu và cuộc hội thoại diễn ra theo các lượt xen kẽ giữa người dùng và trợ lý. Điều này hoạt động tốt cho chat, nhưng agent không phải là chat — chúng là các tiến trình chạy dài mà ngữ cảnh thay đổi một cách hợp lệ giữa chừng tác vụ. Một agent có thể cần cập nhật quyền của nó giữa chừng, điều chỉnh ngân sách token, hoặc tiếp nhận ngữ cảnh môi trường mới phát sinh trong quá trình thực thi. API cũ khiến việc này trở nên khó xử.

Hai lựa chọn tồi của bạn là: gửi lại toàn bộ system prompt (làm hỏng bộ nhớ đệm prompt, buộc phải tính toán lại tốn kém và tăng độ trễ), hoặc tiêm bản cập nhật dưới dạng tin nhắn người dùng (làm ô nhiễm cuộc hội thoại với nội dung không thực sự đến từ người dùng, gây nhầm lẫn cho sự hiểu biết của mô hình về cuộc đối thoại). Cả hai đều không tốt. Gửi lại lãng phí token và thời gian; giả mạo lượt người dùng làm giảm chất lượng hành vi của mô hình. Cả hai đều là giải pháp tạm thời cho một khả năng còn thiếu.

Các Mục Hệ Thống Giải Quyết Vấn Đề Này Như Thế Nào

Cách tiếp cận mới cho phép bạn chèn trực tiếp các mục hệ thống vào mảng tin nhắn khi cuộc hội thoại tiến triển. Khi agent của bạn cần cập nhật hướng dẫn giữa chừng tác vụ, bạn thêm một mục hệ thống tại điểm đó trong chuỗi tin nhắn. Claude coi đó là hướng dẫn được cập nhật mà không làm hỏng bộ nhớ đệm prompt và bản cập nhật không bị nhầm là lượt người dùng. Cuộc hội thoại vẫn sạch sẽ, bộ nhớ đệm vẫn nguyên vẹn, và bản cập nhật hướng dẫn đến đúng nơi cần đến.

Anthropic định hình chính xác các trường hợp sử dụng: cập nhật quyền, ngân sách token hoặc ngữ cảnh môi trường khi một agent đang chạy. Hãy xem xét một agent bắt đầu với quyền chỉ đọc và có được quyền ghi giữa chừng tác vụ — bạn có thể cập nhật hướng dẫn của nó để phản ánh các quyền mới tại thời điểm chúng thay đổi. Hoặc một agent có ngân sách token cần điều chỉnh dựa trên tiến độ. Hoặc một agent cần ngữ cảnh môi trường mới (thay đổi cấu hình, ràng buộc mới) được tiêm vào giữa lúc đang chạy. Tất cả những điều này giờ đây diễn ra một cách sạch sẽ thông qua các mục hệ thống thay vì thông qua việc gửi lại làm hỏng bộ nhớ đệm hoặc tin nhắn người dùng giả mạo làm ô nhiễm cuộc hội thoại.

📬 Thấy nội dung này hữu ích?

Một thông tin chuyên sâu về AI có thể hành động mỗi tuần. Kèm theo gói prompt miễn phí khi bạn đăng ký.

Đăng ký miễn phí →

Tại Sao Điều Này Quan Trọng Đối Với Người Xây Dựng SaaS

Đối với các nhà phát triển xây dựng sản phẩm trên Claude API, những lợi ích thực tế là cụ thể: tiết kiệm token (không cần gửi lại toàn bộ system prompt để cập nhật hướng dẫn), giảm độ trễ (bộ nhớ đệm prompt vẫn nguyên vẹn, do đó không phải tính toán lại tốn kém), và trạng thái hội thoại sạch sẽ hơn (không có tin nhắn người dùng giả mạo làm sai lệch sự hiểu biết của mô hình). Nếu bạn đang xây dựng một sản phẩm SaaS nơi hành vi của Claude cần thích ứng trong một phiên làm việc — thay đổi chế độ, cập nhật ràng buộc, điều chỉnh quyền — điều này cho phép bạn làm điều đó một cách hiệu quả mà không phải đánh đổi như trước đây.

Nó kết hợp tự nhiên với các cải tiến dành cho nhà phát triển khác của Opus 4.8. Kết hợp với quy trình làm việc động cho các tác vụ quy mô lớn (được đề cập trong bài phân tích chuyên sâu về quy trình làm việc động của chúng tôi) cùng khả năng gọi công cụ và tính trung thực được cải thiện của mô hình, thay đổi về các mục hệ thống này hoàn thiện một bản phát hành rõ ràng tập trung vào việc làm cho Claude tốt hơn để xây dựng các agent tự động, chạy dài. Để bắt đầu với Opus 4.8 trong hệ thống của bạn, hãy xem hướng dẫn chuyển đổi của chúng tôi.

Khi bạn tạo ra các system prompt và hướng dẫn điều khiển agent của mình, sự chính xác càng quan trọng hơn trong bối cảnh agent nơi các hướng dẫn được tích lũy qua nhiều bước. Prompt Optimizer miễn phí giúp bạn viết các hướng dẫn hệ thống rõ ràng, không mơ hồ, và TresPrompt mang tối ưu hóa prompt vào quy trình làm việc của bạn.

📬 Muốn nhiều nội dung như thế này hơn?

Một thông tin chuyên sâu về AI có thể hành động mỗi tuần. Kèm theo gói prompt miễn phí khi bạn đăng ký.

Đăng ký miễn phí →

Vấn Đề Bộ Nhớ Đệm Prompt, Được Giải Thích

Để đánh giá đầy đủ lý do tại sao thay đổi này quan trọng, cần hiểu về bộ nhớ đệm prompt. Khi bạn gửi một yêu cầu đến Claude, API có thể lưu vào bộ nhớ đệm quá trình xử lý phần tiền tố của prompt — system prompt và ngữ cảnh ban đầu — để các yêu cầu tiếp theo sử dụng lại tiền tố đó nhanh hơn và rẻ hơn. Đối với các agent thực hiện nhiều lệnh gọi với một system prompt dùng chung, việc lưu vào bộ nhớ đệm này là một tối ưu hóa lớn, giảm đáng kể cả độ trễ và chi phí token trong suốt một tác vụ dài. Bộ nhớ đệm là một trong những đòn bẩy hiệu suất quan trọng nhất cho các ứng dụng agent trong thực tế.

Vấn đề là việc cập nhật system prompt làm mất hiệu lực bộ nhớ đệm. Nếu agent của bạn cần thay đổi hướng dẫn giữa chừng tác vụ — điều mà các agent chạy dài thực sự cần làm — bạn phải gửi lại system prompt, điều này làm hỏng bộ nhớ đệm và buộc phải xử lý lại tốn kém. Điều này tạo ra một sự đánh đổi đau đớn: giữ system prompt tĩnh để bảo toàn bộ nhớ đệm (giới hạn tính linh hoạt của agent), hoặc cập nhật nó động và chịu chi phí làm hỏng bộ nhớ đệm (ảnh hưởng đến hiệu suất). Các mục hệ thống mới giải quyết hoàn toàn sự đánh đổi này — bạn có được cập nhật hướng dẫn động VÀ bộ nhớ đệm nguyên vẹn. Đối với các ứng dụng agent khối lượng lớn, đây là một cải thiện đáng kể về chi phí và độ trễ, không chỉ là một sự tiện lợi.

Các Mẫu Kiến Trúc Mà Điều Này Cho Phép

Khả năng về các mục hệ thống mở ra các mẫu kiến trúc sạch sẽ hơn cho những người xây dựng agent. Hãy xem xét một agent theo giai đoạn hoạt động trong các giai đoạn riêng biệt — nghiên cứu, sau đó lập kế hoạch, rồi thực thi — nơi mỗi giai đoạn cần các hướng dẫn khác nhau. Trước đây, bạn sẽ hoặc nhồi nhét tất cả hướng dẫn giai đoạn vào một system prompt phình to hoặc làm hỏng bộ nhớ đệm khi chuyển đổi giữa chúng. Bây giờ bạn có thể tiêm các mục hệ thống cụ thể cho từng giai đoạn khi agent chuyển tiếp giữa các giai đoạn, giữ cho hướng dẫn của mỗi giai đoạn tập trung và bộ nhớ đệm nguyên vẹn. Hành vi của agent thích ứng một cách sạch sẽ với giai đoạn hiện tại của nó mà không có chi phí phát sinh như trước đây.

Một mẫu khác: leo thang quyền hạn. Một agent có thể bắt đầu với các quyền hạn chế và có được quyền truy cập rộng hơn khi nó thể hiện hành vi đúng đắn hoặc đạt đến các điểm kiểm tra nhất định. Với các mục hệ thống, bạn có thể cập nhật ngữ cảnh quyền của agent chính xác khi nó thay đổi, tại đúng điểm trong chuỗi tin nhắn — một mô hình sạch sẽ hơn nhiều so với các giải pháp tạm thời trước đây. Tương tự, các agent hoạt động trong môi trường thay đổi có thể có ngữ cảnh môi trường mới (thay đổi cấu hình, ràng buộc mới, dữ liệu cập nhật) được tiêm dưới dạng các mục hệ thống khi môi trường thay đổi. Những mẫu này trước đây đều có thể thực hiện được nhưng khó xử và kém hiệu quả; các mục hệ thống làm cho chúng sạch sẽ và hiệu suất cao. Đối với các nhà phát triển xây dựng ứng dụng agent nghiêm túc trên Claude, việc áp dụng khả năng này đáng với nỗ lực tích hợp nhỏ, và kết hợp nó với các hướng dẫn hệ thống được tối ưu hóa tốt mang lại cho bạn cả tính linh hoạt và độ tin cậy.

Các Câu Hỏi Thường Gặp

Điều gì đã thay đổi trong Claude Messages API với Opus 4.8?

Messages API hiện chấp nhận các mục hệ thống bên trong mảng tin nhắn. Điều này cho phép nhà phát triển cập nhật hướng dẫn cho Claude giữa chừng tác vụ — mà không làm hỏng bộ nhớ đệm prompt hay phải định tuyến bản cập nhật qua một lượt người dùng. Trước đây bạn phải gửi lại toàn bộ system prompt (làm hỏng bộ nhớ đệm) hoặc tiêm các bản cập nhật dưới dạng tin nhắn người dùng (làm ô nhiễm cuộc hội thoại).

Tại sao việc cập nhật system prompt giữa chừng tác vụ lại quan trọng?

Agent là các tiến trình chạy dài mà ngữ cảnh thay đổi một cách hợp lệ giữa chừng tác vụ — quyền, ngân sách token, ngữ cảnh môi trường. Các mục hệ thống mới cho phép bạn cập nhật hướng dẫn của Claude tại thời điểm chúng thay đổi, một cách sạch sẽ và hiệu quả. Nó tiết kiệm token, giảm độ trễ (bộ nhớ đệm vẫn nguyên vẹn) và giữ cho trạng thái hội thoại sạch sẽ.

Việc cập nhật các mục hệ thống có làm hỏng bộ nhớ đệm prompt không?

Không — đó là lợi ích chính. Các mục hệ thống mới cho phép bạn cập nhật hướng dẫn mà không làm hỏng bộ nhớ đệm prompt, tránh việc tính toán lại tốn kém và tăng độ trễ đến từ việc gửi lại toàn bộ system prompt. Bộ nhớ đệm vẫn nguyên vẹn trong khi các hướng dẫn được cập nhật.

Các trường hợp sử dụng phổ biến cho các mục hệ thống giữa chừng tác vụ là gì?

Anthropic trích dẫn việc cập nhật quyền (ví dụ: một agent có được quyền ghi giữa chừng tác vụ), điều chỉnh ngân sách token dựa trên tiến độ, và tiêm ngữ cảnh môi trường mới (thay đổi cấu hình, ràng buộc mới) khi một agent đang chạy. Bất kỳ kịch bản nào mà các tham số vận hành của agent cần thay đổi trong quá trình thực thi đều được hưởng lợi từ điều này.

Tính năng này có dành riêng cho Opus 4.8 không?

Khả năng về các mục hệ thống của Messages API được ra mắt cùng với Opus 4.8 như một phần của cùng bản phát hành đó. Đây là một tính năng cấp API dành cho các nhà phát triển xây dựng trên Claude. Hãy kiểm tra tài liệu API của Anthropic để biết cú pháp triển khai chính xác và những mô hình nào hỗ trợ nó.

Tiết lộ: Một số liên kết trong bài viết này là liên kết liên kết. Chúng tôi chỉ giới thiệu các công cụ mà chúng tôi đã cá nhân kiểm tra và sử dụng thường xuyên. Xem chính sách tiết lộ đầy đủ của chúng tôi.