أصدرت أنثروبيك Claude Opus 4.8 اليوم، 28 مايو 2026 — بعد 41 يومًا فقط من Opus 4.7. يجلب النموذج الرائد الجديد تحسينات عبر البرمجة، والمهام الوكيلة، والاستدلال، والعمل المعرفي، ويُطرح بنفس سعر سابقه تمامًا. في نفس اليوم، أعلنت أنثروبيك عن جمع 65 مليار دولار في جولة تمويل من السلسلة H بتقييم 965 مليار دولار، متجاوزةً OpenAI رسميًا لتصبح شركة الذكاء الاصطناعي الأعلى قيمة في العالم. حدثان تاريخيان بارزان في يوم واحد.

إذا كنت ستقرأ شيئًا واحدًا فقط عن Opus 4.8، فاقرأ هذا: إنه "تحسين متواضع لكن ملموس" (على حد تعبير أنثروبيك) يطور بشكل ملموس ثلاثة أشياء — البرمجة الوكيلة، والأمانة، والمواءمة — مع تقديم ثلاث ميزات جديدة تغير طريقة عملك مع Claude. إنها ليست القفزة العملاقة التي يعد بها Claude Mythos الذي لم يُصدر بعد، لكنه يعالج مشكلات حقيقية من Opus 4.7 ويضع معيارًا جديدًا في الاختبارات المرجعية التي تهم عمل الذكاء الاصطناعي المستقل.

الخلاصة الأساسية

تم إطلاق Claude Opus 4.8 (معرف API: claude-opus-4-8) في 28 مايو 2026 بأسعار لم تتغير (5 دولارات/مليون مُدخل، 25 دولارًا/مليون مُخرج). يحسن SWE-Bench Pro من 64.3% إلى 69.2%، ويتصدر OSWorld-Verified بنسبة 83.4%، ويتفوق على GPT-5.5 و Gemini 3.1 Pro في العمل المعرفي (GDPval-AA 1890). إنه أقل عرضة بنحو 4 مرات لترك عيوب التعليمات البرمجية تمر دون تعليق. أُطلقت معه ثلاث ميزات جديدة: مهام سير العمل الديناميكية (وكلاء فرعيون متوازيون في Claude Code)، والتحكم في الجهد (claude.ai و Cowork)، وإدخالات النظام في منتصف المهمة في Messages API. أصبح الوضع السريع الآن أرخص بثلاث مرات.

ما الجديد في Claude Opus 4.8؟

التحسين الرئيسي هو القدرة الوكيلة — قدرة Claude على العمل بشكل مستقل عبر مهام متعددة الخطوات باستخدام الأدوات. أبلغ المُختبرون الأوائل عن حكم أكثر دقة، واستخدام أفضل للأدوات، وموثوقية محسنة في مهام سير العمل طويلة الأمد. يطرح النموذج الأسئلة الصحيحة، ويلتقط أخطاءه، ويعترض عندما لا تكون الخطة سليمة، ويبني الثقة حول الاستكشافات المعقدة قبل إجراء تغييرات كبيرة. بالنسبة لأي شخص يستخدم Claude كوكيل مستقل بدلاً من روبوت محادثة، فهذه هي التحسينات الأكثر أهمية.

التحسين الرئيسي الثاني هو الأمانة. دربت أنثروبيك جميع نماذجها لتجنب تقديم ادعاءات لا يمكنها دعمها، لكن نماذج الذكاء الاصطناعي لديها مشكلة مستمرة: فهي تقفز إلى الاستنتاجات، وتدعي بثقة إحراز تقدم عندما تكون الأدلة ضعيفة. Opus 4.8 أكثر عرضة للإشارة إلى الشكوك حول عمله وأقل عرضة لتقديم ادعاءات غير مدعومة. تُظهر تقييمات أنثروبيك أنه أقل عرضة بنحو أربع مرات من Opus 4.7 للسماح بمرور عيوب في التعليمات البرمجية التي كتبها دون تعليق. إنه أول نموذج من Claude يسجل 0% في الإبلاغ غير النقدي عن نتائج معيبة، مع انخفاض في الثقة المفرطة بأكثر من عشرة أضعاف.

التحسين الثالث هو المواءمة. خلص فريق المواءمة في أنثروبيك إلى أن Opus 4.8 "يصل إلى مستويات قياسية جديدة في مقاييسنا للسمات الاجتماعية الإيجابية مثل دعم استقلالية المستخدم والتصرف بما يحقق مصلحة المستخدم الفضلى." معدلات سلوكه غير المواءم — الخداع أو التعاون مع إساءة الاستخدام — أقل بكثير من Opus 4.7 وتشبه Claude Mythos Preview، أفضل نماذج أنثروبيك من حيث المواءمة. (هناك تحذير مقلق واحد يتعلق بوعي التقييم، نغطيه في الغوص العميق في مفارقة الأمانة.)

اختبارات Claude Opus 4.8 المرجعية: كيف يُقارن؟

نشرت أنثروبيك اختبارات مرجعية تقارن Opus 4.8 بسابقه وبالنماذج المنافسة. المكاسب تدريجية لكنها متسقة، ويتصدر Opus 4.8 معظم اختبارات الوكيل والعمل المعرفي. إليك تفصيل الأرقام.

الاختبار المرجعي Opus 4.8 Opus 4.7 ما يقيسه
SWE-Bench Pro69.2%64.3%البرمجة الوكيلة في العالم الحقيقي
OSWorld-Verified83.4%82.3%استخدام الكمبيوتر الوكيل
Online-Mind2Web84%أقلمهام وكيل المتصفح
GDPval-AA1890العمل المعرفي (يتفوق على GPT-5.5 البالغ 1769)
الاستدلال باستخدام الأدوات57.9%54.7%الاستدلال متعدد التخصصات
Terminal-Bench 2.174.6%البرمجة الطرفية (يفوز GPT-5.5 بنسبة 78.2%)

الاستنتاج الصادق: يتصدر Opus 4.8 معظم اختبارات الوكيل واستخدام الكمبيوتر والعمل المعرفي، متفوقًا على كل من GPT-5.5 و Gemini 3.1 Pro في GDPval-AA بهامش واسع. لكنه ليس اكتساحًا كاملاً — لا يزال GPT-5.5 يفوز في Terminal-Bench 2.1 (البرمجة الطرفية الكثيفة)، مسجلاً 78.2% مقابل 74.6% لـ Opus 4.8. إذا كانت مهام سير عملك تهيمن عليها جلسات طرفية طويلة، يظل GPT-5.5 منافسًا. للحصول على مقارنة شاملة وجهاً لوجه، راجع تحليل الاختبارات المرجعية الثلاثية.

📬 هل تجد قيمة في هذا؟

رؤية واحدة قابلة للتطبيق في الذكاء الاصطناعي أسبوعيًا. بالإضافة إلى حزمة تلميحات مجانية عند الاشتراك.

اشترك مجانًا ←

الميزات الثلاث الجديدة التي تنطلق مع Opus 4.8

لم يُطلق Opus 4.8 بمفرده. أصدرت أنثروبيك ثلاث ميزات في نفس اليوم تغير كيفية تفاعلك مع Claude عبر المنتجات.

مهام سير العمل الديناميكية (Claude Code). متاحة في معاينة بحثية لخطط Max و Team و Enterprise، تتيح هذه الميزة لـ Claude تخطيط مهمة كبيرة، وإرسال مئات الوكلاء الفرعيين المتوازيين الذين يعالجون المشكلة من زوايا مستقلة، ونشر وكلاء عدائيين لدحض النتائج، والتكرار حتى تتقارب الإجابات — ثم التحقق من المخرجات قبل الإبلاغ. حالة الاستخدام الرئيسية هي ترحيل قواعد التعليمات البرمجية على نطاق واسع عبر مئات الآلاف من أسطر التعليمات البرمجية، من البداية إلى الدمج، باستخدام مجموعة الاختبارات الحالية كمعيار. نشرح هذا بالكامل في شارح مهام سير العمل الديناميكية.

التحكم في الجهد (claude.ai و Cowork). يتيح لك عنصر تحكم جديد بجوار محدد النموذج اختيار مقدار الجهد الذي يبذله Claude في الاستجابة. يعني الجهد الأعلى أن Claude يفكر بشكل متكرر وأعمق للحصول على استجابات أفضل؛ الجهد الأقل يعني ردودًا أسرع تستهلك حدود المعدل الخاصة بك بشكل أبطأ. هذا متاح على جميع الخطط. يغطي دليل التحكم في الجهد متى تستخدم كل إعداد.

إدخالات النظام في منتصف المهمة (Messages API). تقبل Messages API الآن إدخالات النظام داخل مصفوفة الرسائل، مما يتيح للمطورين تحديث تعليمات Claude في منتصف المهمة دون كسر ذاكرة التخزين المؤقت للتلميحات أو التوجيه عبر دور المستخدم. هذا مهم للوكلاء الذين يحتاجون إلى تحديث الأذونات، أو ميزانيات الرموز، أو سياق البيئة في منتصف التشغيل. التفاصيل في تحليل تغيير API.

التسعير والتوفر

يتوفر Claude Opus 4.8 في كل مكان اليوم. التسعير العادي لم يتغير عن Opus 4.7: 5 دولارات لكل مليون رمز مُدخل و 25 دولارًا لكل مليون رمز مُخرج. سعر الوضع السريع (سرعة 2.5x) هو 10 دولارات/مليون مُدخل و 50 دولارًا/مليون مُخرج — لكن من الجدير بالذكر أن الوضع السريع أصبح الآن أرخص بثلاث مرات مما كان عليه للنماذج السابقة. يصل المطورون إلى النموذج عبر Claude API باستخدام claude-opus-4-8، ويوجهه الاسم المستعار opus الآن إليه تلقائيًا. إنه متاح على Amazon Bedrock و Google Cloud Vertex AI و Microsoft Foundry و GitHub Copilot (مع مضاعف طلب مميز 15x حتى إطلاق الفوترة على أساس الاستخدام في 1 يونيو).

للحصول على أقصى استفادة من Opus 4.8 بغض النظر عن كيفية وصولك إليه، تنتج التلميحات جيدة التنظيم نتائج أفضل بشكل كبير. يشحذ محسن التلميحات المجاني تعليماتك قبل إرسالها، ويجلب TresPrompt التحسين بنقرة واحدة مباشرة إلى Claude و ChatGPT و Gemini.

📬 هل تريد المزيد مثل هذا؟

رؤية واحدة قابلة للتطبيق في الذكاء الاصطناعي أسبوعيًا. بالإضافة إلى حزمة تلميحات مجانية عند الاشتراك.

اشترك مجانًا ←

ما التالي: Claude Mythos

استخدمت أنثروبيك الإعلان عن Opus 4.8 للتشويق لما هو قادم. تخطط الشركة لإصدار فئة جديدة من النماذج بذكاء أعلى حتى من Opus. كجزء من Project Glasswing، يستخدم عدد صغير من المؤسسات بالفعل Claude Mythos Preview لأعمال الأمن السيبراني. تتطلب النماذج عند مستوى القدرة هذا ضمانات سيبرانية أقوى قبل الإصدار العام، لكن أنثروبيك قالت إنها تحرز تقدمًا سريعًا وتتوقع جلب نماذج فئة Mythos لجميع العملاء "في الأسابيع القادمة." تقترب مواءمة Opus 4.8 بالفعل من مستويات Mythos Preview — تلميح لما هو قادم. اقرأ المزيد في تحليل الجدول الزمني لـ Mythos.

أسئلة مكررة

ما هو معرف نموذج Claude Opus 4.8 API؟

معرف نموذج API هو claude-opus-4-8. يوجهه الاسم المستعار opus الآن إليه تلقائيًا، لذا سيتم ترقية عمليات الدمج الحالية التي تستخدم الاسم المستعار. بالنسبة لمتغير سياق المليون رمز، استخدم claude-opus-4-8[1m]. إنه متاح على Claude API و Amazon Bedrock و Google Cloud Vertex AI و Microsoft Foundry.

كم تبلغ تكلفة Claude Opus 4.8؟

الاستخدام العادي هو 5 دولارات لكل مليون رمز مُدخل و 25 دولارًا لكل مليون رمز مُخرج — دون تغيير عن Opus 4.7. تبلغ تكلفة الوضع السريع (سرعة 2.5x) 10 دولارات/مليون مُدخل و 50 دولارًا/مليون مُخرج، وهو أرخص بثلاث مرات مما كان عليه الوضع السريع للنماذج السابقة. التسعير متطابق عبر المنصات السحابية.

هل Claude Opus 4.8 أفضل من GPT-5.5؟

يعتمد ذلك على المهمة. يتصدر Opus 4.8 في البرمجة الوكيلة (SWE-Bench Pro)، واستخدام الكمبيوتر (OSWorld 83.4%)، ومهام المتصفح (Online-Mind2Web 84%)، والعمل المعرفي (GDPval-AA 1890 مقابل 1769 لـ GPT-5.5). لكن GPT-5.5 لا يزال يفوز في Terminal-Bench 2.1 (78.2% مقابل 74.6%) للبرمجة الطرفية الكثيفة. بالنسبة لمعظم الأعمال الوكيلة والمعرفية، Opus 4.8 أقوى؛ للجلسات الطرفية الطويلة، يظل GPT-5.5 منافسًا.

هل يجب أن أرقّي من Opus 4.7 إلى 4.8؟

بالنسبة لمعظم المستخدمين، نعم — إنه بنفس السعر مع اختبارات مرجعية أفضل، وأمانة محسنة بشكل كبير، وإصلاحات لمشكلات إسهاب التعليقات واستدعاء الأدوات في Opus 4.7. الترقية تلقائية إذا كنت تستخدم الاسم المستعار opus. السبب الرئيسي للتردد: إذا كانت مهام سير عملك مضبوطة بشدة على سلوك 4.7، فأعد اختبار تلميحاتك لأن حكم النموذج وإسهابه قد تغيرا. راجع دليل قرار الترقية.

ما هي مهام سير العمل الديناميكية في Claude Opus 4.8؟

مهام سير العمل الديناميكية هي ميزة في Claude Code (معاينة بحثية، Max/Team/Enterprise) تتيح لـ Claude تخطيط مهمة كبيرة وتشغيل مئات الوكلاء الفرعيين المتوازيين في جلسة واحدة. يعالج الوكلاء الفرعيون المشكلات من زوايا مستقلة، ويحاول الوكلاء العدائيون دحض النتائج، ويكرر النظام حتى تتقارب الإجابات قبل الإبلاغ. حالة الاستخدام الرئيسية هي ترحيل قواعد التعليمات البرمجية على نطاق واسع عبر مئات الآلاف من أسطر التعليمات البرمجية.

إفصاح: بعض الروابط في هذه المقالة هي روابط تابعة. نوصي فقط بالأدوات التي اختبرناها شخصيًا ونستخدمها بانتظام. راجع سياسة الإفصاح الكاملة الخاصة بنا.