एंथ्रोपिक ने आज, 28 मई, 2026 को Claude Opus 4.8 जारी किया — Opus 4.7 के ठीक 41 दिन बाद। नया फ्लैगशिप मॉडल कोडिंग, एजेंटिक कार्यों, तर्क और ज्ञान कार्य में सुधार लाता है, और यह अपने पूर्ववर्ती के समान मूल्य पर आता है। उसी दिन, एंथ्रोपिक ने घोषणा की कि उसने $965 बिलियन के मूल्यांकन पर सीरीज़ H फंडिंग में $65 बिलियन जुटाए, आधिकारिक तौर पर OpenAI को पीछे छोड़ते हुए दुनिया की सबसे मूल्यवान AI कंपनी बन गई। एक ही दिन में दो ऐतिहासिक उपलब्धियाँ।

यदि आप Opus 4.8 के बारे में केवल एक चीज़ पढ़ते हैं, तो यह पढ़ें: यह एक "मामूली लेकिन ठोस सुधार" है (एंथ्रोपिक के अपने शब्द), जो तीन चीज़ों को सार्थक रूप से आगे बढ़ाता है — एजेंटिक कोडिंग, ईमानदारी और एलाइनमेंट — जबकि तीन नई सुविधाएँ पेश करता है जो Claude के साथ आपके काम करने के तरीके को बदल देती हैं। यह वह विशाल छलांग नहीं है जो अप्रकाशित Claude Mythos होने का वादा करता है, लेकिन यह Opus 4.7 की वास्तविक समस्याओं को ठीक करता है और स्वायत्त AI कार्य के लिए मायने रखने वाले बेंचमार्क पर एक नया मानक स्थापित करता है।

मुख्य निष्कर्ष

Claude Opus 4.8 (API ID: claude-opus-4-8) 28 मई, 2026 को अपरिवर्तित मूल्य ($5/M इनपुट, $25/M आउटपुट) पर लॉन्च हुआ। यह SWE-Bench Pro को 64.3% से सुधारकर 69.2% करता है, OSWorld-Verified पर 83.4% के साथ अग्रणी है, और ज्ञान कार्य (GDPval-AA 1890) पर GPT-5.5 और Gemini 3.1 Pro से आगे है। कोड की खामियों को बिना टिप्पणी के जाने देने की संभावना लगभग 4 गुना कम है। इसके साथ तीन नई सुविधाएँ लॉन्च हुईं: डायनेमिक वर्कफ़्लो (Claude Code में समानांतर उप-एजेंट), प्रयास नियंत्रण (claude.ai और Cowork), और Messages API में मध्य-कार्य सिस्टम प्रविष्टियाँ। फ़ास्ट मोड अब 3 गुना सस्ता है।

Claude Opus 4.8 में नया क्या है?

मुख्य सुधार एजेंटिक क्षमता है — उपकरणों का उपयोग करके बहु-चरणीय कार्यों के माध्यम से स्वतंत्र रूप से काम करने की Claude की क्षमता। शुरुआती परीक्षकों ने तेज़ निर्णय, बेहतर उपकरण उपयोग और लंबे समय तक चलने वाले वर्कफ़्लो पर बेहतर विश्वसनीयता की रिपोर्ट दी है। मॉडल सही प्रश्न पूछता है, अपनी गलतियों को पकड़ता है, जब कोई योजना सही नहीं होती है तो पीछे हटता है, और बड़े बदलाव करने से पहले जटिल अन्वेषणों के बारे में आत्मविश्वास बनाता है। Claude को चैटबॉट के बजाय एक स्वायत्त एजेंट के रूप में उपयोग करने वाले किसी भी व्यक्ति के लिए, ये ऐसे सुधार हैं जो सबसे अधिक मायने रखते हैं।

दूसरा प्रमुख सुधार ईमानदारी है। एंथ्रोपिक ने अपने सभी मॉडलों को ऐसे दावे करने से बचने के लिए प्रशिक्षित किया जिनका वे समर्थन नहीं कर सकते, लेकिन AI मॉडलों में एक लगातार समस्या है: वे निष्कर्ष पर पहुंच जाते हैं, जब सबूत कमज़ोर होते हैं तब भी आत्मविश्वास से प्रगति का दावा करते हैं। Opus 4.8 में अपने काम के बारे में अनिश्चितताओं को चिह्नित करने की अधिक संभावना है और असमर्थित दावे करने की संभावना कम है। एंथ्रोपिक के मूल्यांकन बताते हैं कि Opus 4.7 की तुलना में इसके द्वारा लिखे गए कोड में खामियों को बिना टिप्पणी के जाने देने की संभावना लगभग चार गुना कम है। यह पहला Claude मॉडल है जिसने त्रुटिपूर्ण परिणामों की बिना आलोचना के रिपोर्ट करने पर 0% स्कोर किया, अति आत्मविश्वास में दस गुना से अधिक की कमी के साथ।

तीसरा सुधार एलाइनमेंट है। एंथ्रोपिक की एलाइनमेंट टीम ने निष्कर्ष निकाला कि Opus 4.8 "उपयोगकर्ता स्वायत्तता का समर्थन करने और उपयोगकर्ता के सर्वोत्तम हित में कार्य करने जैसे सामाजिक-समर्थक लक्षणों के हमारे माप पर नई ऊंचाइयों तक पहुंचता है।" इसके गलत-संरेखित व्यवहार की दरें — धोखाधड़ी या दुरुपयोग में सहयोग — Opus 4.7 से काफी कम हैं और Claude Mythos Preview के समान हैं, जो एंथ्रोपिक का सबसे अच्छी तरह से संरेखित मॉडल है। (मूल्यांकन जागरूकता के बारे में एक चिंताजनक चेतावनी है, जिसे हम अपने ईमानदारी विरोधाभास गहन विश्लेषण में शामिल करते हैं।)

Claude Opus 4.8 बेंचमार्क: इसकी तुलना कैसे की जाती है?

एंथ्रोपिक ने Opus 4.8 की तुलना उसके पूर्ववर्ती और प्रतिस्पर्धी मॉडलों से करने वाले बेंचमार्क प्रकाशित किए। लाभ वृद्धिशील लेकिन सुसंगत हैं, और Opus 4.8 अधिकांश एजेंटिक और ज्ञान-कार्य परीक्षणों पर अग्रणी है। यहाँ बताया गया है कि संख्याएँ कैसे विभाजित होती हैं।

बेंचमार्क Opus 4.8 Opus 4.7 यह क्या मापता है
SWE-Bench Pro69.2%64.3%वास्तविक दुनिया की एजेंटिक कोडिंग
OSWorld-Verified83.4%82.3%एजेंटिक कंप्यूटर उपयोग
Online-Mind2Web84%कमब्राउज़र-एजेंट कार्य
GDPval-AA1890ज्ञान कार्य (GPT-5.5 के 1769 से बेहतर)
उपकरणों के साथ तर्क57.9%54.7%बहु-विषयक तर्क
Terminal-Bench 2.174.6%टर्मिनल कोडिंग (GPT-5.5 78.2% पर जीतता है)

ईमानदार निष्कर्ष: Opus 4.8 अधिकांश एजेंटिक, कंप्यूटर-उपयोग और ज्ञान-कार्य बेंचमार्क पर अग्रणी है, GDPval-AA पर GPT-5.5 और Gemini 3.1 Pro दोनों को व्यापक अंतर से हराता है। लेकिन यह पूर्ण जीत नहीं है — GPT-5.5 अभी भी Terminal-Bench 2.1 (टर्मिनल-भारी कोडिंग) जीतता है, Opus 4.8 के 74.6% की तुलना में 78.2% स्कोर करता है। यदि आपका वर्कफ़्लो लंबे टर्मिनल सत्रों पर हावी है, तो GPT-5.5 प्रतिस्पर्धी बना हुआ है। पूर्ण आमने-सामने की तुलना के लिए, हमारा तीन-तरफ़ा बेंचमार्क विश्लेषण देखें।

📬 इससे मूल्य प्राप्त कर रहे हैं?

प्रति सप्ताह एक कार्रवाई योग्य AI अंतर्दृष्टि। साथ ही सब्सक्राइब करने पर एक मुफ़्त प्रॉम्प्ट पैक।

मुफ़्त सब्सक्राइब करें →

Opus 4.8 के साथ लॉन्च होने वाली तीन नई सुविधाएँ

Opus 4.8 अकेला लॉन्च नहीं हुआ। एंथ्रोपिक ने उसी दिन तीन सुविधाएँ जारी कीं जो उत्पादों में Claude के साथ आपके इंटरैक्ट करने के तरीके को बदल देती हैं।

डायनेमिक वर्कफ़्लो (Claude Code)। Max, Team और Enterprise प्लान के लिए रिसर्च प्रीव्यू में उपलब्ध, यह सुविधा Claude को एक बड़े कार्य की योजना बनाने, सैकड़ों समानांतर उप-एजेंट भेजने देती है जो स्वतंत्र कोणों से समस्या पर हमला करते हैं, निष्कर्षों का खंडन करने के लिए प्रतिकूल एजेंट तैनात करते हैं, और उत्तरों के अभिसरण तक पुनरावृत्ति करते हैं — फिर रिपोर्ट करने से पहले आउटपुट सत्यापित करते हैं। प्रमुख उपयोग का मामला सैकड़ों हज़ारों लाइनों के कोड में कोडबेस-स्केल माइग्रेशन है, शुरुआत से मर्ज तक, मौजूदा परीक्षण सूट को मानक के रूप में उपयोग करते हुए। हम इसे अपने डायनेमिक वर्कफ़्लो व्याख्याकार में पूरी तरह से समझाते हैं।

प्रयास नियंत्रण (claude.ai और Cowork)। मॉडल चयनकर्ता के बगल में एक नया नियंत्रण आपको यह चुनने देता है कि Claude किसी प्रतिक्रिया में कितना प्रयास लगाता है। उच्च प्रयास का अर्थ है कि Claude बेहतर प्रतिक्रियाओं के लिए अधिक बार और गहराई से सोचता है; कम प्रयास का अर्थ है तेज़ उत्तर जो आपकी दर सीमाओं का अधिक धीरे-धीरे उपयोग करते हैं। यह सभी प्लान पर उपलब्ध है। हमारी प्रयास नियंत्रण गाइड बताती है कि प्रत्येक सेटिंग का उपयोग कब करना है।

मध्य-कार्य सिस्टम प्रविष्टियाँ (Messages API)। Messages API अब संदेश सरणी के अंदर सिस्टम प्रविष्टियाँ स्वीकार करता है, जिससे डेवलपर्स प्रॉम्प्ट कैश को तोड़े बिना या उपयोगकर्ता मोड़ के माध्यम से रूट किए बिना मध्य-कार्य में Claude के निर्देशों को अपडेट कर सकते हैं। यह उन एजेंटों के लिए मायने रखता है जिन्हें मध्य-रन में अनुमतियाँ, टोकन बजट या पर्यावरण संदर्भ अपडेट करने की आवश्यकता होती है। विवरण हमारे API परिवर्तन विश्लेषण में।

मूल्य निर्धारण और उपलब्धता

Claude Opus 4.8 आज हर जगह उपलब्ध है। नियमित मूल्य निर्धारण Opus 4.7 से अपरिवर्तित है: $5 प्रति मिलियन इनपुट टोकन और $25 प्रति मिलियन आउटपुट टोकन। फ़ास्ट मोड (2.5x गति) की कीमत $10/M इनपुट और $50/M आउटपुट है — लेकिन विशेष रूप से, फ़ास्ट मोड अब पिछले मॉडलों की तुलना में तीन गुना सस्ता है। डेवलपर्स claude-opus-4-8 का उपयोग करके Claude API के माध्यम से मॉडल तक पहुंचते हैं, और opus उपनाम अब स्वचालित रूप से इसे रूट करता है। यह Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry और GitHub Copilot पर उपलब्ध है (1 जून को उपयोग-आधारित बिलिंग शुरू होने तक 15x प्रीमियम अनुरोध गुणक के साथ)।

Opus 4.8 से अधिकतम लाभ उठाने के लिए, चाहे आप इसे कैसे भी एक्सेस करें, अच्छी तरह से संरचित प्रॉम्प्ट नाटकीय रूप से बेहतर परिणाम उत्पन्न करते हैं। मुफ़्त Prompt Optimizer भेजने से पहले आपके निर्देशों को तेज़ करता है, और TresPrompt सीधे Claude, ChatGPT और Gemini में एक-क्लिक अनुकूलन लाता है।

📬 इस तरह की और सामग्री चाहिए?

प्रति सप्ताह एक कार्रवाई योग्य AI अंतर्दृष्टि। साथ ही सब्सक्राइब करने पर एक मुफ़्त प्रॉम्प्ट पैक।

मुफ़्त सब्सक्राइब करें →

अगला क्या है: Claude Mythos

एंथ्रोपिक ने Opus 4.8 की घोषणा का उपयोग यह बताने के लिए किया कि क्या आने वाला है। कंपनी Opus से भी अधिक उच्च बुद्धिमत्ता वाले मॉडलों का एक नया वर्ग जारी करने की योजना बना रही है। Project Glasswing के हिस्से के रूप में, कम संख्या में संगठन पहले से ही साइबर सुरक्षा कार्य के लिए Claude Mythos Preview का उपयोग कर रहे हैं। उस क्षमता स्तर के मॉडलों को सामान्य रिलीज़ से पहले मजबूत साइबर सुरक्षा उपायों की आवश्यकता होती है, लेकिन एंथ्रोपिक ने कहा कि वह तेज़ी से प्रगति कर रहा है और "आने वाले हफ्तों में" सभी ग्राहकों के लिए Mythos-श्रेणी के मॉडल लाने की उम्मीद करता है। Opus 4.8 का एलाइनमेंट पहले से ही Mythos Preview स्तरों के करीब है — जो आने वाले का एक संकेत है। हमारे Mythos समयरेखा विश्लेषण में और पढ़ें।

अक्सर पूछे जाने वाले प्रश्न

Claude Opus 4.8 API मॉडल ID क्या है?

API मॉडल ID claude-opus-4-8 है। opus उपनाम अब स्वचालित रूप से इसे रूट करता है, इसलिए उपनाम का उपयोग करने वाले मौजूदा एकीकरण अपग्रेड हो जाएंगे। 1-मिलियन-टोकन संदर्भ संस्करण के लिए, claude-opus-4-8[1m] का उपयोग करें। यह Claude API, Amazon Bedrock, Google Cloud Vertex AI और Microsoft Foundry पर उपलब्ध है।

Claude Opus 4.8 की लागत कितनी है?

नियमित उपयोग $5 प्रति मिलियन इनपुट टोकन और $25 प्रति मिलियन आउटपुट टोकन है — Opus 4.7 से अपरिवर्तित। फ़ास्ट मोड (2.5x गति) की लागत $10/M इनपुट और $50/M आउटपुट है, जो पिछले मॉडलों के फ़ास्ट मोड की तुलना में तीन गुना सस्ता है। मूल्य निर्धारण क्लाउड प्लेटफ़ॉर्म पर समान है।

क्या Claude Opus 4.8 GPT-5.5 से बेहतर है?

यह कार्य पर निर्भर करता है। Opus 4.8 एजेंटिक कोडिंग (SWE-Bench Pro), कंप्यूटर उपयोग (OSWorld 83.4%), ब्राउज़र कार्यों (Online-Mind2Web 84%), और ज्ञान कार्य (GDPval-AA 1890 बनाम GPT-5.5 का 1769) पर अग्रणी है। लेकिन GPT-5.5 अभी भी टर्मिनल-भारी कोडिंग के लिए Terminal-Bench 2.1 (78.2% बनाम 74.6%) जीतता है। अधिकांश एजेंटिक और ज्ञान कार्य के लिए, Opus 4.8 मजबूत है; लंबे टर्मिनल सत्रों के लिए, GPT-5.5 प्रतिस्पर्धी बना हुआ है।

क्या मुझे Opus 4.7 से 4.8 में अपग्रेड करना चाहिए?

अधिकांश उपयोगकर्ताओं के लिए, हाँ — यह बेहतर बेंचमार्क, नाटकीय रूप से बेहतर ईमानदारी और Opus 4.7 की टिप्पणी-वाचालता और उपकरण-कॉलिंग समस्याओं के समाधान के साथ समान मूल्य पर है। यदि आप opus उपनाम का उपयोग करते हैं तो अपग्रेड स्वचालित है। संकोच करने का मुख्य कारण: यदि आपके वर्कफ़्लो 4.7 के व्यवहार के लिए भारी रूप से ट्यून किए गए हैं, तो अपने प्रॉम्प्ट का पुनः परीक्षण करें क्योंकि मॉडल का निर्णय और वाचालता बदल गई है। हमारी अपग्रेड निर्णय गाइड देखें।

Claude Opus 4.8 में डायनेमिक वर्कफ़्लो क्या हैं?

डायनेमिक वर्कफ़्लो एक Claude Code सुविधा है (रिसर्च प्रीव्यू, Max/Team/Enterprise) जो Claude को एक बड़े कार्य की योजना बनाने और एक ही सत्र में सैकड़ों समानांतर उप-एजेंट चलाने देती है। उप-एजेंट स्वतंत्र कोणों से समस्याओं पर हमला करते हैं, प्रतिकूल एजेंट निष्कर्षों का खंडन करने का प्रयास करते हैं, और सिस्टम रिपोर्ट करने से पहले उत्तरों के अभिसरण तक पुनरावृत्ति करता है। मुख्य उपयोग का मामला सैकड़ों हज़ारों लाइनों के कोड में कोडबेस-स्केल माइग्रेशन है।

प्रकटीकरण: इस लेख में कुछ लिंक सहबद्ध लिंक हैं। हम केवल उन उपकरणों की अनुशंसा करते हैं जिनका हमने व्यक्तिगत रूप से परीक्षण किया है और नियमित रूप से उपयोग करते हैं। हमारी पूर्ण प्रकटीकरण नीति देखें।