Anthropic bugün, 28 Mayıs 2026'da Claude Opus 4.8'i piyasaya sürdü — Opus 4.7'den sadece 41 gün sonra. Yeni amiral gemisi model, kodlama, etmen tabanlı görevler, akıl yürütme ve bilgi işleme alanlarında iyileştirmeler getiriyor ve selefiyle tamamen aynı fiyattan sunuluyor. Aynı gün Anthropic, 965 milyar dolar değerleme üzerinden 65 milyar dolarlık Seri H fonlaması sağladığını duyurarak OpenAI'ı resmen geride bıraktı ve dünyanın en değerli yapay zeka şirketi oldu. Tek bir günde iki tarihi dönüm noktası.
Opus 4.8 hakkında tek bir şey okuyacaksanız, şunu okuyun: "mütevazı ama somut bir iyileştirme" (Anthropic'in kendi ifadesi) ve üç şeyi anlamlı şekilde ilerletiyor — etmen tabanlı kodlama, dürüstlük ve uyumluluk — aynı zamanda Claude ile çalışma şeklinizi değiştiren üç yeni özellik sunuyor. Henüz piyasaya sürülmemiş Claude Mythos'un vaat ettiği dev sıçrama değil, ancak Opus 4.7'deki gerçek sorunları düzeltiyor ve otonom yapay zeka çalışmaları için önem taşıyan kıyaslamalarda yeni bir çıta belirliyor.
Kilit Çıkarım
Claude Opus 4.8 (API Kimliği: claude-opus-4-8) 28 Mayıs 2026'da değişmeyen fiyatlandırmayla (giriş token başına 5$/M, çıkış token başına 25$/M) piyasaya sürüldü. SWE-Bench Pro'yu %64,3'ten %69,2'ye çıkarıyor, OSWorld-Verified'da %83,4 ile lider ve bilgi işlemede (GDPval-AA 1890) GPT-5.5 ile Gemini 3.1 Pro'yu geride bırakıyor. Kod hatalarının belirtilmeden geçilmesine izin verme olasılığı yaklaşık 4 kat daha düşük. Üç yeni özellik de onunla birlikte sunuldu: dinamik iş akışları (Claude Code'da paralel alt etmenler), çaba kontrolü (claude.ai ve Cowork) ve Mesajlar API'sinde görev ortası sistem girişleri. Hızlı mod artık 3 kat daha ucuz.
Claude Opus 4.8'deki Yenilikler
Öne çıkan iyileştirme etmen yeteneği — Claude'un araçları kullanarak çok adımlı görevleri bağımsızca yürütebilme becerisi. Erken test kullanıcıları daha keskin muhakeme, daha iyi araç kullanımı ve uzun süreli iş akışlarında gelişmiş güvenilirlik bildiriyor. Model doğru soruları soruyor, kendi hatalarını yakalıyor, bir plan sağlam olmadığında itiraz ediyor ve büyük değişiklikler yapmadan önce karmaşık keşifler konusunda güven inşa ediyor. Claude'u bir sohbet botu yerine otonom bir etmen olarak kullanan herkes için en önemli iyileştirmeler bunlar.
İkinci büyük iyileştirme dürüstlük. Anthropic tüm modellerini destekleyemeyecekleri iddialarda bulunmaktan kaçınmaları için eğitti, ancak yapay zeka modellerinin kalıcı bir sorunu var: kanıtlar zayıfken ilerleme kaydettiklerini kendinden emin bir şekilde iddia ederek hemen sonuca atlıyorlar. Opus 4.8, çalışmalarıyla ilgili belirsizlikleri işaretleme ve desteklenmeyen iddialarda bulunmama olasılığı daha yüksek. Anthropic'in değerlendirmeleri, Opus 4.7'ye kıyasla yazdığı koddaki hataların belirtilmeden geçilmesine izin verme olasılığının yaklaşık dört kat daha düşük olduğunu gösteriyor. Hatalı sonuçları eleştirmeden raporlama konusunda %0 puan alan ilk Claude modeli ve aşırı özgüvende on kattan fazla azalma var.
Üçüncü iyileştirme uyumluluk. Anthropic'in uyumluluk ekibi, Opus 4.8'in "kullanıcı özerkliğini destekleme ve kullanıcının en iyi çıkarına göre hareket etme gibi toplum yanlısı özellikler ölçütlerimizde yeni zirvelere ulaştığı" sonucuna vardı. Yanlış hizalanmış davranış oranları — aldatma veya kötüye kullanımla işbirliği — Opus 4.7'den önemli ölçüde düşük ve Anthropic'in en iyi hizalanmış modeli Claude Mythos Preview'a benzer. (Değerlendirme farkındalığıyla ilgili endişe verici bir uyarı var, bunu dürüstlük paradoksu derinlemesine incelememizde ele alıyoruz.)
Claude Opus 4.8 Kıyaslamaları: Nasıl Karşılaştırılıyor?
Anthropic, Opus 4.8'i selefi ve rakip modellerle karşılaştıran kıyaslamalar yayınladı. Kazanımlar kademeli ama tutarlı ve Opus 4.8 çoğu etmen tabanlı ve bilgi işleme testinde lider. İşte rakamların dökümü.
| Kıyaslama | Opus 4.8 | Opus 4.7 | Ölçtüğü Şey |
|---|---|---|---|
| SWE-Bench Pro | %69,2 | %64,3 | Gerçek dünya etmen tabanlı kodlama |
| OSWorld-Verified | %83,4 | %82,3 | Etmen tabanlı bilgisayar kullanımı |
| Online-Mind2Web | %84 | daha düşük | Tarayıcı etmeni görevleri |
| GDPval-AA | 1890 | — | Bilgi işleme (GPT-5.5'in 1769'unu geçiyor) |
| Araçlarla akıl yürütme | %57,9 | %54,7 | Çok disiplinli akıl yürütme |
| Terminal-Bench 2.1 | %74,6 | — | Terminal kodlama (%78,2 ile GPT-5.5 kazanıyor) |
Dürüst çıkarım: Opus 4.8 çoğu etmen tabanlı, bilgisayar kullanımı ve bilgi işleme kıyaslamasında lider, GDPval-AA'da hem GPT-5.5'i hem de Gemini 3.1 Pro'yu geniş bir farkla geride bırakıyor. Ancak tam bir üstünlük değil — GPT-5.5 hala Terminal-Bench 2.1'de (terminal ağırlıklı kodlama) %78,2'ye karşı Opus 4.8'in %74,6'sı ile kazanıyor. Eğer iş akışınız uzun terminal oturumlarının hakimiyetindeyse, GPT-5.5 rekabetçi olmaya devam ediyor. Tam bir baş başa karşılaştırma için üç yönlü kıyaslama dökümümüze bakın.
📬 Bundan değer alıyor musunuz?
Haftada bir uygulanabilir yapay zeka içgörüsü. Ayrıca abone olduğunuzda ücretsiz bir istem paketi.
Ücretsiz abone ol →Opus 4.8 ile Birlikte Gelen Üç Yeni Özellik
Opus 4.8 tek başına piyasaya sürülmedi. Anthropic aynı gün, Claude ile ürünler arasında etkileşim şeklinizi değiştiren üç özellik sundu.
Dinamik iş akışları (Claude Code). Max, Team ve Enterprise planları için araştırma önizlemesinde sunulan bu özellik, Claude'un büyük bir görevi planlamasına, soruna bağımsız açılardan yaklaşan yüzlerce paralel alt etmeni devreye sokmasına, bulguları çürütmek için karşıt etmenler konuşlandırmasına ve yanıtlar yakınsayana kadar yinelemesine — ardından raporlamadan önce çıktıları doğrulamasına olanak tanır. Amiral gemisi kullanım durumu, mevcut test paketini çıta olarak kullanarak, başlangıçtan birleştirmeye kadar yüz binlerce satır kod üzerinde kod tabanı ölçeğinde geçişlerdir. Bunu dinamik iş akışları açıklayıcımızda tam olarak inceliyoruz.
Çaba kontrolü (claude.ai ve Cowork). Model seçicinin yanındaki yeni bir kontrol, Claude'un bir yanıta ne kadar çaba harcayacağını seçmenizi sağlar. Daha yüksek çaba, Claude'un daha iyi yanıtlar için daha sık ve derinlemesine düşünmesi anlamına gelir; daha düşük çaba, hız limitlerinizi daha yavaş tüketen daha hızlı yanıtlar demektir. Bu, tüm planlarda mevcuttur. Çaba kontrolleri rehberimiz her ayarın ne zaman kullanılacağını ele alıyor.
Görev ortası sistem girişleri (Messages API). Messages API artık mesaj dizisi içinde sistem girişlerini kabul ederek, geliştiricilerin istem önbelleğini kırmadan veya bir kullanıcı dönüşü üzerinden yönlendirme yapmadan Claude'un talimatlarını görev ortasında güncellemelerine olanak tanır. Bu, izinleri, token bütçelerini veya ortam bağlamını çalışma sırasında güncellemesi gereken etmenler için önemlidir. Detaylar API değişiklik dökümümüzde.
Fiyatlandırma ve Kullanılabilirlik
Claude Opus 4.8 bugün her yerde kullanılabilir. Normal fiyatlandırma Opus 4.7 ile değişmedi: milyon giriş tokeni başına 5$ ve milyon çıkış tokeni başına 25$. Hızlı mod (2,5 kat hız) 10$/M giriş ve 50$/M çıkış olarak fiyatlandırıldı — ancak dikkat çekici şekilde, hızlı mod artık önceki modeller için olduğundan üç kat daha ucuz. Geliştiriciler modele Claude API üzerinden claude-opus-4-8 kullanarak erişiyor ve opus takma adı artık otomatik olarak ona yönlendiriyor. Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry ve GitHub Copilot'ta (1 Haziran'da kullanım tabanlı faturalandırma başlayana kadar 15 kat premium istek çarpanıyla) kullanılabilir.
Nasıl erişirseniz erişin Opus 4.8'den en iyi şekilde yararlanmak için, iyi yapılandırılmış istemler önemli ölçüde daha iyi sonuçlar üretir. Ücretsiz Prompt Optimizer göndermeden önce talimatlarınızı keskinleştirir ve TresPrompt doğrudan Claude, ChatGPT ve Gemini'ye tek tıklamayla optimizasyon getirir.
📬 Bunun gibi daha fazlasını ister misiniz?
Haftada bir uygulanabilir yapay zeka içgörüsü. Ayrıca abone olduğunuzda ücretsiz bir istem paketi.
Ücretsiz abone ol →Sırada Ne Var: Claude Mythos
Anthropic, Opus 4.8 duyurusunu yakında gelecekleri tanıtmak için kullandı. Şirket, Opus'tan daha yüksek zekaya sahip yeni bir model sınıfı piyasaya sürmeyi planlıyor. Project Glasswing'in bir parçası olarak, az sayıda kuruluş siber güvenlik çalışmaları için halihazırda Claude Mythos Preview kullanıyor. Bu yetenek seviyesindeki modeller genel kullanıma sunulmadan önce daha güçlü siber korumalar gerektiriyor, ancak Anthropic hızlı ilerleme kaydettiğini ve Mythos sınıfı modelleri "önümüzdeki haftalarda" tüm müşterilere sunmayı beklediğini söyledi. Opus 4.8'in uyumluluğu zaten Mythos Preview seviyelerine yaklaşıyor — geleceklerin bir ipucu. Mythos zaman çizelgesi analizimizde daha fazlasını okuyun.
Sıkça Sorulan Sorular
Claude Opus 4.8 API model kimliği nedir?
API model kimliği claude-opus-4-8'dir. Opus takma adı artık otomatik olarak ona yönlendiriyor, bu nedenle takma adı kullanan mevcut entegrasyonlar yükseltilecektir. 1 milyon token bağlam varyantı için claude-opus-4-8[1m] kullanın. Claude API, Amazon Bedrock, Google Cloud Vertex AI ve Microsoft Foundry'de mevcuttur.
Claude Opus 4.8'in maliyeti ne kadar?
Normal kullanım milyon giriş tokeni başına 5$ ve milyon çıkış tokeni başına 25$'dır — Opus 4.7'den değişmedi. Hızlı mod (2,5 kat hız) 10$/M giriş ve 50$/M çıkış maliyetindedir, bu önceki modeller için hızlı modun olduğundan üç kat daha ucuzdur. Fiyatlandırma bulut platformları arasında aynıdır.
Claude Opus 4.8, GPT-5.5'ten daha mı iyi?
Göreve bağlıdır. Opus 4.8 etmen tabanlı kodlama (SWE-Bench Pro), bilgisayar kullanımı (OSWorld %83,4), tarayıcı görevleri (Online-Mind2Web %84) ve bilgi işlemede (GDPval-AA 1890 vs GPT-5.5'in 1769'u) liderdir. Ancak GPT-5.5 terminal ağırlıklı kodlama için Terminal-Bench 2.1'i (%78,2 vs %74,6) hala kazanıyor. Çoğu etmen tabanlı ve bilgi işleme görevi için Opus 4.8 daha güçlüdür; uzun terminal oturumları için GPT-5.5 rekabetçi kalmaya devam ediyor.
Opus 4.7'den 4.8'e yükseltme yapmalı mıyım?
Çoğu kullanıcı için evet — aynı fiyata daha iyi kıyaslamalar, önemli ölçüde geliştirilmiş dürüstlük ve Opus 4.7'nin yorum ayrıntısı ve araç çağırma sorunları için düzeltmeler. Opus takma adını kullanıyorsanız yükseltme otomatiktir. Tereddüt etmek için ana neden: iş akışlarınız 4.7'nin davranışına yoğun şekilde ayarlanmışsa, modelin muhakemesi ve ayrıntı düzeyi değiştiği için istemlerinizi yeniden test edin. Yükseltme karar rehberimize bakın.
Claude Opus 4.8'deki dinamik iş akışları nedir?
Dinamik iş akışları, Claude'un büyük bir görevi planlamasına ve tek bir oturumda yüzlerce paralel alt etmen çalıştırmasına olanak tanıyan bir Claude Code özelliğidir (araştırma önizlemesi, Max/Team/Enterprise). Alt etmenler sorunlara bağımsız açılardan yaklaşır, karşıt etmenler bulguları çürütmeye çalışır ve sistem raporlamadan önce yanıtlar yakınsayana kadar yineler. Ana kullanım durumu, yüz binlerce satır kod üzerinde kod tabanı ölçeğinde geçişlerdir.
Açıklama: Bu makaledeki bazı bağlantılar satış ortağı bağlantılarıdır. Yalnızca kişisel olarak test ettiğimiz ve düzenli olarak kullandığımız araçları öneriyoruz. Tam açıklama politikamıza bakın.