Anthropic đã phát hành Claude Opus 4.8 vào hôm nay, ngày 28 tháng 5 năm 2026 — chỉ 41 ngày sau Opus 4.7. Mô hình chủ lực mới mang đến những cải tiến về lập trình, tác vụ tác tử, suy luận và công việc tri thức, đồng thời được cung cấp với mức giá hoàn toàn giữ nguyên so với phiên bản tiền nhiệm. Cùng ngày, Anthropic công bố đã huy động được 65 tỷ USD trong vòng gọi vốn Series H với định giá 965 tỷ USD, chính thức vượt qua OpenAI để trở thành công ty AI có giá trị nhất thế giới. Hai cột mốc lịch sử chỉ trong một ngày.

Nếu bạn chỉ đọc một điều về Opus 4.8, hãy đọc điều này: đó là một "cải tiến khiêm tốn nhưng rõ rệt" (theo chính lời của Anthropic), nâng cao đáng kể ba yếu tố — lập trình tác tử, tính trung thực và sự điều chỉnh — đồng thời giới thiệu ba tính năng mới thay đổi cách bạn làm việc với Claude. Đây không phải là bước nhảy vọt khổng lồ như lời hứa hẹn của Claude Mythos chưa phát hành, nhưng nó khắc phục những vấn đề thực tế từ Opus 4.7 và thiết lập chuẩn mực mới trên các bài đánh giá quan trọng cho công việc AI tự chủ.

Điểm chính cần nhớ

Claude Opus 4.8 (API ID: claude-opus-4-8) ra mắt ngày 28/5/2026 với mức giá không đổi ($5/triệu token đầu vào, $25/triệu token đầu ra). Nó cải thiện SWE-Bench Pro từ 64,3% lên 69,2%, dẫn đầu OSWorld-Verified ở mức 83,4%, và vượt qua GPT-5.5 cùng Gemini 3.1 Pro về công việc tri thức (GDPval-AA 1890). Khả năng để lọt lỗi code mà không được đề cập đến thấp hơn khoảng 4 lần. Ba tính năng mới ra mắt cùng lúc: quy trình làm việc động (tác tử phụ song song trong Claude Code), kiểm soát nỗ lực (claude.ai và Cowork), và mục nhập hệ thống giữa tác vụ trong Messages API. Chế độ nhanh giờ rẻ hơn 3 lần.

Có gì mới trong Claude Opus 4.8?

Cải tiến nổi bật là năng lực tác tử — khả năng làm việc độc lập của Claude qua các tác vụ nhiều bước sử dụng công cụ. Những người dùng thử nghiệm ban đầu báo cáo khả năng phán đoán sắc bén hơn, sử dụng công cụ tốt hơn và độ tin cậy được cải thiện trong các quy trình làm việc dài hơi. Mô hình đặt những câu hỏi đúng, tự phát hiện lỗi của mình, phản biện khi một kế hoạch không hợp lý, và xây dựng sự tự tin xung quanh các khám phá phức tạp trước khi thực hiện những thay đổi lớn. Đối với bất kỳ ai sử dụng Claude như một tác tử tự chủ thay vì chatbot, đây là những cải tiến quan trọng nhất.

Cải tiến lớn thứ hai là tính trung thực. Anthropic đã huấn luyện tất cả các mô hình của mình để tránh đưa ra những tuyên bố mà chúng không thể hỗ trợ, nhưng các mô hình AI có một vấn đề dai dẳng: chúng vội vàng kết luận, tự tin tuyên bố tiến triển khi bằng chứng còn mỏng. Opus 4.8 có xu hướng gắn cờ những điều không chắc chắn về công việc của mình cao hơn và ít có khả năng đưa ra những tuyên bố thiếu căn cứ hơn. Các đánh giá của Anthropic cho thấy nó ít có khả năng để lọt các lỗi trong code do chính nó viết mà không được nhận xét đến thấp hơn khoảng bốn lần so với Opus 4.7. Đây là mô hình Claude đầu tiên đạt 0% về việc báo cáo kết quả sai sót một cách thiếu phản biện, với mức giảm hơn mười lần về sự tự tin thái quá.

Cải tiến thứ ba là sự điều chỉnh. Nhóm điều chỉnh của Anthropic kết luận rằng Opus 4.8 "đạt đến những đỉnh cao mới trên các thước đo của chúng tôi về các đặc điểm ủng hộ xã hội như hỗ trợ quyền tự chủ của người dùng và hành động vì lợi ích tốt nhất của người dùng." Tỷ lệ hành vi lệch lạc — lừa dối hoặc hợp tác với mục đích lạm dụng — thấp hơn đáng kể so với Opus 4.7 và tương tự Claude Mythos Preview, mô hình được điều chỉnh tốt nhất của Anthropic. (Có một lưu ý đáng lo ngại về nhận thức đánh giá, mà chúng tôi đề cập trong bài phân tích chuyên sâu về nghịch lý trung thực.)

Điểm chuẩn Claude Opus 4.8: So sánh thế nào?

Anthropic đã công bố các điểm chuẩn so sánh Opus 4.8 với phiên bản tiền nhiệm và các mô hình cạnh tranh. Mức tăng là từng bước nhưng nhất quán, và Opus 4.8 dẫn đầu trong hầu hết các bài kiểm tra tác tử và công việc tri thức. Dưới đây là cách các con số phân tích.

Điểm chuẩn Opus 4.8 Opus 4.7 Đo lường
SWE-Bench Pro69,2%64,3%Lập trình tác tử thực tế
OSWorld-Verified83,4%82,3%Sử dụng máy tính tác tử
Online-Mind2Web84%thấp hơnTác vụ tác tử trình duyệt
GDPval-AA1890Công việc tri thức (đánh bại GPT-5.5 ở mức 1769)
Suy luận với công cụ57,9%54,7%Suy luận đa lĩnh vực
Terminal-Bench 2.174,6%Lập trình terminal (GPT-5.5 thắng với 78,2%)

Kết luận trung thực: Opus 4.8 dẫn đầu trong hầu hết các bài đánh giá tác tử, sử dụng máy tính và công việc tri thức, đánh bại cả GPT-5.5 và Gemini 3.1 Pro trên GDPval-AA với cách biệt lớn. Nhưng đó không phải là một chiến thắng tuyệt đối — GPT-5.5 vẫn thắng Terminal-Bench 2.1 (lập trình thiên về terminal), đạt 78,2% so với 74,6% của Opus 4.8. Nếu quy trình làm việc của bạn chủ yếu là các phiên terminal dài, GPT-5.5 vẫn có tính cạnh tranh. Để có so sánh đối đầu đầy đủ, hãy xem phân tích điểm chuẩn ba bên của chúng tôi.

📬 Thấy nội dung này hữu ích?

Một thông tin chi tiết AI thiết thực mỗi tuần. Kèm theo gói prompt miễn phí khi bạn đăng ký.

Đăng ký miễn phí →

Ba tính năng mới ra mắt cùng Opus 4.8

Opus 4.8 không ra mắt một mình. Anthropic đã tung ra ba tính năng trong cùng ngày, thay đổi cách bạn tương tác với Claude trên các sản phẩm.

Quy trình làm việc động (Claude Code). Có sẵn trong bản xem trước nghiên cứu cho các gói Max, Team và Enterprise, tính năng này cho phép Claude lên kế hoạch cho một tác vụ lớn, điều phối hàng trăm tác tử phụ song song tấn công vấn đề từ các góc độ độc lập, triển khai các tác tử đối nghịch để bác bỏ các phát hiện, và lặp lại cho đến khi các câu trả lời hội tụ — sau đó xác minh đầu ra trước khi báo cáo lại. Trường hợp sử dụng chủ lực là di chuyển quy mô cơ sở mã nguồn trên hàng trăm nghìn dòng code, từ khởi động đến hợp nhất, sử dụng bộ kiểm thử hiện có làm tiêu chuẩn. Chúng tôi phân tích đầy đủ điều này trong bài giải thích về quy trình làm việc động.

Kiểm soát nỗ lực (claude.ai và Cowork). Một điều khiển mới bên cạnh bộ chọn mô hình cho phép bạn chọn mức độ nỗ lực mà Claude bỏ vào một phản hồi. Nỗ lực cao hơn có nghĩa là Claude suy nghĩ thường xuyên và sâu sắc hơn để có phản hồi tốt hơn; nỗ lực thấp hơn có nghĩa là phản hồi nhanh hơn và sử dụng giới hạn tốc độ của bạn chậm hơn. Tính năng này có sẵn trên tất cả các gói. Hướng dẫn về kiểm soát nỗ lực của chúng tôi đề cập đến thời điểm sử dụng từng thiết lập.

Mục nhập hệ thống giữa tác vụ (Messages API). Messages API hiện chấp nhận các mục nhập hệ thống bên trong mảng tin nhắn, cho phép các nhà phát triển cập nhật hướng dẫn của Claude giữa tác vụ mà không làm hỏng bộ nhớ đệm prompt hoặc phải định tuyến qua một lượt người dùng. Điều này quan trọng đối với các tác tử cần cập nhật quyền, ngân sách token hoặc ngữ cảnh môi trường giữa chừng. Chi tiết trong bài phân tích thay đổi API của chúng tôi.

Giá cả và tình trạng sẵn có

Claude Opus 4.8 hiện có sẵn ở mọi nơi từ hôm nay. Giá thông thường không đổi so với Opus 4.7: $5 cho mỗi triệu token đầu vào và $25 cho mỗi triệu token đầu ra. Chế độ nhanh (tốc độ 2,5x) có giá $10/triệu đầu vào và $50/triệu đầu ra — nhưng đáng chú ý, chế độ nhanh hiện rẻ hơn ba lần so với các mô hình trước đây. Các nhà phát triển truy cập mô hình qua Claude API bằng claude-opus-4-8 và bí danh opus hiện tự động định tuyến đến nó. Nó có sẵn trên Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry và GitHub Copilot (với hệ số nhân yêu cầu cao cấp 15x cho đến khi thanh toán theo mức sử dụng ra mắt vào ngày 1 tháng 6).

Để khai thác tối đa Opus 4.8 bất kể bạn truy cập bằng cách nào, các prompt có cấu trúc tốt sẽ tạo ra kết quả tốt hơn đáng kể. Prompt Optimizer miễn phí làm sắc nét hướng dẫn của bạn trước khi bạn gửi chúng, và TresPrompt mang đến tối ưu hóa một cú nhấp chuột trực tiếp vào Claude, ChatGPT và Gemini.

📬 Muốn nhận thêm nội dung như thế này?

Một thông tin chi tiết AI thiết thực mỗi tuần. Kèm theo gói prompt miễn phí khi bạn đăng ký.

Đăng ký miễn phí →

Tiếp theo là gì: Claude Mythos

Anthropic đã sử dụng thông báo Opus 4.8 để hé lộ những gì sắp tới. Công ty có kế hoạch phát hành một lớp mô hình mới với trí thông minh thậm chí còn cao hơn Opus. Là một phần của Dự án Glasswing, một số ít tổ chức đang sử dụng Claude Mythos Preview cho công việc an ninh mạng. Các mô hình ở cấp độ năng lực đó đòi hỏi các biện pháp bảo vệ mạng mạnh mẽ hơn trước khi phát hành rộng rãi, nhưng Anthropic cho biết họ đang đạt được tiến bộ nhanh chóng và dự kiến sẽ mang các mô hình lớp Mythos đến tất cả khách hàng "trong những tuần tới." Sự điều chỉnh của Opus 4.8 đã tiệm cận cấp độ Mythos Preview — một gợi ý về những gì sắp tới. Đọc thêm trong phân tích dòng thời gian Mythos của chúng tôi.

Câu hỏi thường gặp

ID mô hình API của Claude Opus 4.8 là gì?

ID mô hình API là claude-opus-4-8. Bí danh opus hiện tự động định tuyến đến nó, vì vậy các tích hợp hiện có sử dụng bí danh sẽ được nâng cấp. Đối với biến thể ngữ cảnh 1 triệu token, sử dụng claude-opus-4-8[1m]. Nó có sẵn trên Claude API, Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry.

Claude Opus 4.8 có giá bao nhiêu?

Sử dụng thông thường là $5 cho mỗi triệu token đầu vào và $25 cho mỗi triệu token đầu ra — không đổi so với Opus 4.7. Chế độ nhanh (tốc độ 2,5x) có giá $10/triệu đầu vào và $50/triệu đầu ra, rẻ hơn ba lần so với chế độ nhanh của các mô hình trước đây. Giá cả giống hệt nhau trên các nền tảng đám mây.

Claude Opus 4.8 có tốt hơn GPT-5.5 không?

Điều này tùy thuộc vào tác vụ. Opus 4.8 dẫn đầu về lập trình tác tử (SWE-Bench Pro), sử dụng máy tính (OSWorld 83,4%), tác vụ trình duyệt (Online-Mind2Web 84%) và công việc tri thức (GDPval-AA 1890 so với 1769 của GPT-5.5). Nhưng GPT-5.5 vẫn thắng Terminal-Bench 2.1 (78,2% so với 74,6%) cho lập trình thiên về terminal. Đối với hầu hết công việc tác tử và tri thức, Opus 4.8 mạnh hơn; đối với các phiên terminal dài, GPT-5.5 vẫn có tính cạnh tranh.

Tôi có nên nâng cấp từ Opus 4.7 lên 4.8 không?

Đối với hầu hết người dùng, có — cùng mức giá với điểm chuẩn tốt hơn, tính trung thực được cải thiện đáng kể và sửa các lỗi về độ dài dòng bình luận và gọi công cụ của Opus 4.7. Việc nâng cấp là tự động nếu bạn sử dụng bí danh opus. Lý do chính để do dự: nếu quy trình làm việc của bạn được tinh chỉnh nhiều cho hành vi của 4.7, hãy kiểm tra lại prompt của bạn vì khả năng phán đoán và độ dài dòng của mô hình đã thay đổi. Xem hướng dẫn quyết định nâng cấp của chúng tôi.

Quy trình làm việc động trong Claude Opus 4.8 là gì?

Quy trình làm việc động là một tính năng của Claude Code (bản xem trước nghiên cứu, Max/Team/Enterprise) cho phép Claude lập kế hoạch cho một tác vụ lớn và chạy hàng trăm tác tử phụ song song trong một phiên duy nhất. Các tác tử phụ tấn công vấn đề từ các góc độ độc lập, các tác tử đối nghịch cố gắng bác bỏ các phát hiện và hệ thống lặp lại cho đến khi các câu trả lời hội tụ trước khi báo cáo lại. Trường hợp sử dụng chính là di chuyển quy mô cơ sở mã nguồn trên hàng trăm nghìn dòng code.

Tiết lộ: Một số liên kết trong bài viết này là liên kết liên kết. Chúng tôi chỉ đề xuất các công cụ mà chúng tôi đã đích thân kiểm tra và sử dụng thường xuyên. Xem chính sách tiết lộ đầy đủ của chúng tôi.