What is the Claude Opus 4.8 API model ID?

The API model ID is claude-opus-4-8. The opus alias now routes to it automatically, so existing integrations using the alias will upgrade. For the 1-million-token context variant, use claude-opus-4-8[1m]. It's available on the Claude API, Amazon Bedrock, Google Cloud Vertex AI, and Microsoft Foundry.

How much does Claude Opus 4.8 cost?

Regular usage is $5 per million input tokens and $25 per million output tokens — unchanged from Opus 4.7. Fast mode (2.5x speed) costs $10/M input and $50/M output, which is three times cheaper than fast mode was for previous models. Pricing is identical across cloud platforms.

Is Claude Opus 4.8 better than GPT-5.5?

It depends on the task. Opus 4.8 leads on agentic coding (SWE-Bench Pro), computer use (OSWorld 83.4%), browser tasks (Online-Mind2Web 84%), and knowledge work (GDPval-AA 1890 vs GPT-5.5's 1769). But GPT-5.5 still wins Terminal-Bench 2.1 (78.2% vs 74.6%) for terminal-heavy coding. For most agentic and knowledge work, Opus 4.8 is stronger; for long terminal sessions, GPT-5.5 remains competitive.

Should I upgrade from Opus 4.7 to 4.8?

For most users, yes — it's the same price with better benchmarks, dramatically improved honesty, and fixes for Opus 4.7's comment-verbosity and tool-calling issues. The upgrade is automatic if you use the opus alias. The main reason to hesitate: if your workflows are heavily tuned to 4.7's behavior, retest your prompts since the model's judgment and verbosity have changed. See our upgrade decision guide.

What are dynamic workflows in Claude Opus 4.8?

Dynamic workflows is a Claude Code feature (research preview, Max/Team/Enterprise) that lets Claude plan a large task and run hundreds of parallel subagents in a single session. The subagents attack problems from independent angles, adversarial agents try to refute findings, and the system iterates until answers converge before reporting back. The main use case is codebase-scale migrations across hundreds of thousands of lines of code. Disclosure: Some links in this article are affiliate links. We only recommend tools we've personally tested and use regularly. See our full disclosure policy.

क्लाड ऑपस 4.8 आ गया: सब कुछ नया, हर बेंचमार्क, और असल में क्या बदला

आज जारी किया गया तेज़ निर्णय क्षमता, सस्ते फ़ास्ट मोड, और उसी दिन $965B मूल्यांकन की घोषणा के साथ। यहाँ पूरा विश्लेषण है।

एंथ्रोपिक ने आज, 28 मई, 2026 को Claude Opus 4.8 जारी किया — Opus 4.7 के ठीक 41 दिन बाद। नया फ्लैगशिप मॉडल कोडिंग, एजेंटिक कार्यों, तर्क और ज्ञान कार्य में सुधार लाता है, और यह अपने पूर्ववर्ती के समान मूल्य पर आता है। उसी दिन, एंथ्रोपिक ने घोषणा की कि उसने $965 बिलियन के मूल्यांकन पर सीरीज़ H फंडिंग में $65 बिलियन जुटाए, आधिकारिक तौर पर OpenAI को पीछे छोड़ते हुए दुनिया की सबसे मूल्यवान AI कंपनी बन गई। एक ही दिन में दो ऐतिहासिक उपलब्धियाँ।

यदि आप Opus 4.8 के बारे में केवल एक चीज़ पढ़ते हैं, तो यह पढ़ें: यह एक "मामूली लेकिन ठोस सुधार" है (एंथ्रोपिक के अपने शब्द), जो तीन चीज़ों को सार्थक रूप से आगे बढ़ाता है — एजेंटिक कोडिंग, ईमानदारी और एलाइनमेंट — जबकि तीन नई सुविधाएँ पेश करता है जो Claude के साथ आपके काम करने के तरीके को बदल देती हैं। यह वह विशाल छलांग नहीं है जो अप्रकाशित Claude Mythos होने का वादा करता है, लेकिन यह Opus 4.7 की वास्तविक समस्याओं को ठीक करता है और स्वायत्त AI कार्य के लिए मायने रखने वाले बेंचमार्क पर एक नया मानक स्थापित करता है।

मुख्य निष्कर्ष

Claude Opus 4.8 (API ID: claude-opus-4-8) 28 मई, 2026 को अपरिवर्तित मूल्य ($5/M इनपुट, $25/M आउटपुट) पर लॉन्च हुआ। यह SWE-Bench Pro को 64.3% से सुधारकर 69.2% करता है, OSWorld-Verified पर 83.4% के साथ अग्रणी है, और ज्ञान कार्य (GDPval-AA 1890) पर GPT-5.5 और Gemini 3.1 Pro से आगे है। कोड की खामियों को बिना टिप्पणी के जाने देने की संभावना लगभग 4 गुना कम है। इसके साथ तीन नई सुविधाएँ लॉन्च हुईं: डायनेमिक वर्कफ़्लो (Claude Code में समानांतर उप-एजेंट), प्रयास नियंत्रण (claude.ai और Cowork), और Messages API में मध्य-कार्य सिस्टम प्रविष्टियाँ। फ़ास्ट मोड अब 3 गुना सस्ता है।

Claude Opus 4.8 में नया क्या है?

मुख्य सुधार एजेंटिक क्षमता है — उपकरणों का उपयोग करके बहु-चरणीय कार्यों के माध्यम से स्वतंत्र रूप से काम करने की Claude की क्षमता। शुरुआती परीक्षकों ने तेज़ निर्णय, बेहतर उपकरण उपयोग और लंबे समय तक चलने वाले वर्कफ़्लो पर बेहतर विश्वसनीयता की रिपोर्ट दी है। मॉडल सही प्रश्न पूछता है, अपनी गलतियों को पकड़ता है, जब कोई योजना सही नहीं होती है तो पीछे हटता है, और बड़े बदलाव करने से पहले जटिल अन्वेषणों के बारे में आत्मविश्वास बनाता है। Claude को चैटबॉट के बजाय एक स्वायत्त एजेंट के रूप में उपयोग करने वाले किसी भी व्यक्ति के लिए, ये ऐसे सुधार हैं जो सबसे अधिक मायने रखते हैं।

दूसरा प्रमुख सुधार ईमानदारी है। एंथ्रोपिक ने अपने सभी मॉडलों को ऐसे दावे करने से बचने के लिए प्रशिक्षित किया जिनका वे समर्थन नहीं कर सकते, लेकिन AI मॉडलों में एक लगातार समस्या है: वे निष्कर्ष पर पहुंच जाते हैं, जब सबूत कमज़ोर होते हैं तब भी आत्मविश्वास से प्रगति का दावा करते हैं। Opus 4.8 में अपने काम के बारे में अनिश्चितताओं को चिह्नित करने की अधिक संभावना है और असमर्थित दावे करने की संभावना कम है। एंथ्रोपिक के मूल्यांकन बताते हैं कि Opus 4.7 की तुलना में इसके द्वारा लिखे गए कोड में खामियों को बिना टिप्पणी के जाने देने की संभावना लगभग चार गुना कम है। यह पहला Claude मॉडल है जिसने त्रुटिपूर्ण परिणामों की बिना आलोचना के रिपोर्ट करने पर 0% स्कोर किया, अति आत्मविश्वास में दस गुना से अधिक की कमी के साथ।

तीसरा सुधार एलाइनमेंट है। एंथ्रोपिक की एलाइनमेंट टीम ने निष्कर्ष निकाला कि Opus 4.8 "उपयोगकर्ता स्वायत्तता का समर्थन करने और उपयोगकर्ता के सर्वोत्तम हित में कार्य करने जैसे सामाजिक-समर्थक लक्षणों के हमारे माप पर नई ऊंचाइयों तक पहुंचता है।" इसके गलत-संरेखित व्यवहार की दरें — धोखाधड़ी या दुरुपयोग में सहयोग — Opus 4.7 से काफी कम हैं और Claude Mythos Preview के समान हैं, जो एंथ्रोपिक का सबसे अच्छी तरह से संरेखित मॉडल है। (मूल्यांकन जागरूकता के बारे में एक चिंताजनक चेतावनी है, जिसे हम अपने ईमानदारी विरोधाभास गहन विश्लेषण में शामिल करते हैं।)

Claude Opus 4.8 बेंचमार्क: इसकी तुलना कैसे की जाती है?

एंथ्रोपिक ने Opus 4.8 की तुलना उसके पूर्ववर्ती और प्रतिस्पर्धी मॉडलों से करने वाले बेंचमार्क प्रकाशित किए। लाभ वृद्धिशील लेकिन सुसंगत हैं, और Opus 4.8 अधिकांश एजेंटिक और ज्ञान-कार्य परीक्षणों पर अग्रणी है। यहाँ बताया गया है कि संख्याएँ कैसे विभाजित होती हैं।

बेंचमार्क	Opus 4.8	Opus 4.7	यह क्या मापता है
SWE-Bench Pro	69.2%	64.3%	वास्तविक दुनिया की एजेंटिक कोडिंग
OSWorld-Verified	83.4%	82.3%	एजेंटिक कंप्यूटर उपयोग
Online-Mind2Web	84%	कम	ब्राउज़र-एजेंट कार्य
GDPval-AA	1890	—	ज्ञान कार्य (GPT-5.5 के 1769 से बेहतर)
उपकरणों के साथ तर्क	57.9%	54.7%	बहु-विषयक तर्क
Terminal-Bench 2.1	74.6%	—	टर्मिनल कोडिंग (GPT-5.5 78.2% पर जीतता है)

ईमानदार निष्कर्ष: Opus 4.8 अधिकांश एजेंटिक, कंप्यूटर-उपयोग और ज्ञान-कार्य बेंचमार्क पर अग्रणी है, GDPval-AA पर GPT-5.5 और Gemini 3.1 Pro दोनों को व्यापक अंतर से हराता है। लेकिन यह पूर्ण जीत नहीं है — GPT-5.5 अभी भी Terminal-Bench 2.1 (टर्मिनल-भारी कोडिंग) जीतता है, Opus 4.8 के 74.6% की तुलना में 78.2% स्कोर करता है। यदि आपका वर्कफ़्लो लंबे टर्मिनल सत्रों पर हावी है, तो GPT-5.5 प्रतिस्पर्धी बना हुआ है। पूर्ण आमने-सामने की तुलना के लिए, हमारा तीन-तरफ़ा बेंचमार्क विश्लेषण देखें।

📬 इससे मूल्य प्राप्त कर रहे हैं?

प्रति सप्ताह एक कार्रवाई योग्य AI अंतर्दृष्टि। साथ ही सब्सक्राइब करने पर एक मुफ़्त प्रॉम्प्ट पैक।

मुफ़्त सब्सक्राइब करें →

Opus 4.8 के साथ लॉन्च होने वाली तीन नई सुविधाएँ

Opus 4.8 अकेला लॉन्च नहीं हुआ। एंथ्रोपिक ने उसी दिन तीन सुविधाएँ जारी कीं जो उत्पादों में Claude के साथ आपके इंटरैक्ट करने के तरीके को बदल देती हैं।

डायनेमिक वर्कफ़्लो (Claude Code)। Max, Team और Enterprise प्लान के लिए रिसर्च प्रीव्यू में उपलब्ध, यह सुविधा Claude को एक बड़े कार्य की योजना बनाने, सैकड़ों समानांतर उप-एजेंट भेजने देती है जो स्वतंत्र कोणों से समस्या पर हमला करते हैं, निष्कर्षों का खंडन करने के लिए प्रतिकूल एजेंट तैनात करते हैं, और उत्तरों के अभिसरण तक पुनरावृत्ति करते हैं — फिर रिपोर्ट करने से पहले आउटपुट सत्यापित करते हैं। प्रमुख उपयोग का मामला सैकड़ों हज़ारों लाइनों के कोड में कोडबेस-स्केल माइग्रेशन है, शुरुआत से मर्ज तक, मौजूदा परीक्षण सूट को मानक के रूप में उपयोग करते हुए। हम इसे अपने डायनेमिक वर्कफ़्लो व्याख्याकार में पूरी तरह से समझाते हैं।

प्रयास नियंत्रण (claude.ai और Cowork)। मॉडल चयनकर्ता के बगल में एक नया नियंत्रण आपको यह चुनने देता है कि Claude किसी प्रतिक्रिया में कितना प्रयास लगाता है। उच्च प्रयास का अर्थ है कि Claude बेहतर प्रतिक्रियाओं के लिए अधिक बार और गहराई से सोचता है; कम प्रयास का अर्थ है तेज़ उत्तर जो आपकी दर सीमाओं का अधिक धीरे-धीरे उपयोग करते हैं। यह सभी प्लान पर उपलब्ध है। हमारी प्रयास नियंत्रण गाइड बताती है कि प्रत्येक सेटिंग का उपयोग कब करना है।

मध्य-कार्य सिस्टम प्रविष्टियाँ (Messages API)। Messages API अब संदेश सरणी के अंदर सिस्टम प्रविष्टियाँ स्वीकार करता है, जिससे डेवलपर्स प्रॉम्प्ट कैश को तोड़े बिना या उपयोगकर्ता मोड़ के माध्यम से रूट किए बिना मध्य-कार्य में Claude के निर्देशों को अपडेट कर सकते हैं। यह उन एजेंटों के लिए मायने रखता है जिन्हें मध्य-रन में अनुमतियाँ, टोकन बजट या पर्यावरण संदर्भ अपडेट करने की आवश्यकता होती है। विवरण हमारे API परिवर्तन विश्लेषण में।

मूल्य निर्धारण और उपलब्धता

Claude Opus 4.8 आज हर जगह उपलब्ध है। नियमित मूल्य निर्धारण Opus 4.7 से अपरिवर्तित है: $5 प्रति मिलियन इनपुट टोकन और $25 प्रति मिलियन आउटपुट टोकन। फ़ास्ट मोड (2.5x गति) की कीमत $10/M इनपुट और $50/M आउटपुट है — लेकिन विशेष रूप से, फ़ास्ट मोड अब पिछले मॉडलों की तुलना में तीन गुना सस्ता है। डेवलपर्स claude-opus-4-8 का उपयोग करके Claude API के माध्यम से मॉडल तक पहुंचते हैं, और opus उपनाम अब स्वचालित रूप से इसे रूट करता है। यह Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry और GitHub Copilot पर उपलब्ध है (1 जून को उपयोग-आधारित बिलिंग शुरू होने तक 15x प्रीमियम अनुरोध गुणक के साथ)।

Opus 4.8 से अधिकतम लाभ उठाने के लिए, चाहे आप इसे कैसे भी एक्सेस करें, अच्छी तरह से संरचित प्रॉम्प्ट नाटकीय रूप से बेहतर परिणाम उत्पन्न करते हैं। मुफ़्त Prompt Optimizer भेजने से पहले आपके निर्देशों को तेज़ करता है, और TresPrompt सीधे Claude, ChatGPT और Gemini में एक-क्लिक अनुकूलन लाता है।

📬 इस तरह की और सामग्री चाहिए?

मुफ़्त सब्सक्राइब करें →

अगला क्या है: Claude Mythos

एंथ्रोपिक ने Opus 4.8 की घोषणा का उपयोग यह बताने के लिए किया कि क्या आने वाला है। कंपनी Opus से भी अधिक उच्च बुद्धिमत्ता वाले मॉडलों का एक नया वर्ग जारी करने की योजना बना रही है। Project Glasswing के हिस्से के रूप में, कम संख्या में संगठन पहले से ही साइबर सुरक्षा कार्य के लिए Claude Mythos Preview का उपयोग कर रहे हैं। उस क्षमता स्तर के मॉडलों को सामान्य रिलीज़ से पहले मजबूत साइबर सुरक्षा उपायों की आवश्यकता होती है, लेकिन एंथ्रोपिक ने कहा कि वह तेज़ी से प्रगति कर रहा है और "आने वाले हफ्तों में" सभी ग्राहकों के लिए Mythos-श्रेणी के मॉडल लाने की उम्मीद करता है। Opus 4.8 का एलाइनमेंट पहले से ही Mythos Preview स्तरों के करीब है — जो आने वाले का एक संकेत है। हमारे Mythos समयरेखा विश्लेषण में और पढ़ें।

अक्सर पूछे जाने वाले प्रश्न

Claude Opus 4.8 API मॉडल ID क्या है?

API मॉडल ID claude-opus-4-8 है। opus उपनाम अब स्वचालित रूप से इसे रूट करता है, इसलिए उपनाम का उपयोग करने वाले मौजूदा एकीकरण अपग्रेड हो जाएंगे। 1-मिलियन-टोकन संदर्भ संस्करण के लिए, claude-opus-4-8[1m] का उपयोग करें। यह Claude API, Amazon Bedrock, Google Cloud Vertex AI और Microsoft Foundry पर उपलब्ध है।

Claude Opus 4.8 की लागत कितनी है?

नियमित उपयोग $5 प्रति मिलियन इनपुट टोकन और $25 प्रति मिलियन आउटपुट टोकन है — Opus 4.7 से अपरिवर्तित। फ़ास्ट मोड (2.5x गति) की लागत $10/M इनपुट और $50/M आउटपुट है, जो पिछले मॉडलों के फ़ास्ट मोड की तुलना में तीन गुना सस्ता है। मूल्य निर्धारण क्लाउड प्लेटफ़ॉर्म पर समान है।

क्या Claude Opus 4.8 GPT-5.5 से बेहतर है?

यह कार्य पर निर्भर करता है। Opus 4.8 एजेंटिक कोडिंग (SWE-Bench Pro), कंप्यूटर उपयोग (OSWorld 83.4%), ब्राउज़र कार्यों (Online-Mind2Web 84%), और ज्ञान कार्य (GDPval-AA 1890 बनाम GPT-5.5 का 1769) पर अग्रणी है। लेकिन GPT-5.5 अभी भी टर्मिनल-भारी कोडिंग के लिए Terminal-Bench 2.1 (78.2% बनाम 74.6%) जीतता है। अधिकांश एजेंटिक और ज्ञान कार्य के लिए, Opus 4.8 मजबूत है; लंबे टर्मिनल सत्रों के लिए, GPT-5.5 प्रतिस्पर्धी बना हुआ है।

क्या मुझे Opus 4.7 से 4.8 में अपग्रेड करना चाहिए?

अधिकांश उपयोगकर्ताओं के लिए, हाँ — यह बेहतर बेंचमार्क, नाटकीय रूप से बेहतर ईमानदारी और Opus 4.7 की टिप्पणी-वाचालता और उपकरण-कॉलिंग समस्याओं के समाधान के साथ समान मूल्य पर है। यदि आप opus उपनाम का उपयोग करते हैं तो अपग्रेड स्वचालित है। संकोच करने का मुख्य कारण: यदि आपके वर्कफ़्लो 4.7 के व्यवहार के लिए भारी रूप से ट्यून किए गए हैं, तो अपने प्रॉम्प्ट का पुनः परीक्षण करें क्योंकि मॉडल का निर्णय और वाचालता बदल गई है। हमारी अपग्रेड निर्णय गाइड देखें।

Claude Opus 4.8 में डायनेमिक वर्कफ़्लो क्या हैं?

डायनेमिक वर्कफ़्लो एक Claude Code सुविधा है (रिसर्च प्रीव्यू, Max/Team/Enterprise) जो Claude को एक बड़े कार्य की योजना बनाने और एक ही सत्र में सैकड़ों समानांतर उप-एजेंट चलाने देती है। उप-एजेंट स्वतंत्र कोणों से समस्याओं पर हमला करते हैं, प्रतिकूल एजेंट निष्कर्षों का खंडन करने का प्रयास करते हैं, और सिस्टम रिपोर्ट करने से पहले उत्तरों के अभिसरण तक पुनरावृत्ति करता है। मुख्य उपयोग का मामला सैकड़ों हज़ारों लाइनों के कोड में कोडबेस-स्केल माइग्रेशन है।

प्रकटीकरण: इस लेख में कुछ लिंक सहबद्ध लिंक हैं। हम केवल उन उपकरणों की अनुशंसा करते हैं जिनका हमने व्यक्तिगत रूप से परीक्षण किया है और नियमित रूप से उपयोग करते हैं। हमारी पूर्ण प्रकटीकरण नीति देखें।