Anthropic, amiral gemisi büyük dil modelinin en yeni sürümü olan Opus 4.5'i resmi olarak piyasaya sürerek 4.5 serisinin tamamlandığını duyurdu. Bu sürüm, önemli performans iyileştirmeleri ve Google Chrome ile Microsoft Excel gibi popüler platformlar için kritik entegrasyonlar sunarak gelişmiş yapay zeka yeteneklerini kullanıcılara daha erişilebilir hale getiriyor.

Gelişmiş Performans ve Benchmarklar

Opus 4.5, çeşitli zorlu benchmarklarda son teknoloji performans sergiliyor. SWE-Bench ve Terminal-bench dahil olmak üzere kodlama zorluklarında, tau2-bench ve MCP Atlas ile araç kullanımında ve ARC-AGI 2 ile GPQA Diamond puanlarının kanıtladığı gibi genel problem çözmede üstün başarı gösteriyor. Özellikle, Opus 4.5, doğrulanmış SWE-Bench kodlama benchmarkında yüzde 80'lik bir puanı aşan ilk model olarak yazılım geliştirme görevlerindeki gelişmiş yeteneklerinin altını çiziyor.

Chrome ve Excel için Sorunsuz Entegrasyonlar

Bu sürümün temel odak noktalarından biri, bilgisayar kullanımını ve e-tablo yeteneklerini geliştirmektir. Opus 4.5 ile birlikte Anthropic, Claude for Chrome uzantısını ve Claude for Excel ürününü pilot aşamalarının ötesine taşıyarak geniş çapta kullanıma sunuyor. Chrome uzantısı tüm Claude Max aboneleri için erişilebilir olacakken, Excel odaklı model Max, Team ve Enterprise kullanıcılarına hitap ederek iş akışlarını bu temel uygulamalar içinde doğrudan kolaylaştıracak.

Bellek İyileştirmeleri ve "Kesintisiz Sohbet"

Opus 4.5 ayrıca, uzun bağlamlı işlemleri daha etkili bir şekilde ele almak için tasarlanmış önemli bellek iyileştirmeleri içeriyor. Bu gelişmeler, modelin uzun süreli etkileşimler boyunca bilgiyi yönetme biçiminde önemli mimari değişiklikler gerektirdi. Anthropic'in araştırma ürün yönetimi başkanı Dianne Na Penn, bu değişikliklerin önemini vurguladı:

“Opus 4.5 ile eğitimde genel uzun bağlam kalitesinde iyileştirmeler yaptık, ancak bağlam pencereleri tek başına yeterli olmayacak. Sadece daha uzun bir bağlam penceresine sahip olmanın yanı sıra, hatırlanması gereken doğru detayları bilmek gerçekten önemlidir.”

Bu bellek iyileştirmeleri, ücretli Claude kullanıcıları için merakla beklenen "kesintisiz sohbet" özelliğini de mümkün kıldı. Bu özellik, sistem bağlam belleğini kullanıcıyı uyarmadan akıllıca sıkıştırdığı için, model bağlam penceresi sınırına ulaşsa bile konuşmaların kesintisiz devam etmesini sağlıyor.

Ajan Yapay Zeka Uygulamaları için Tasarlandı

Opus 4.5'teki yükseltmelerin çoğu, özellikle Opus'un Haiku destekli alt ajanlardan oluşan bir grubu denetleyen birincil ajan olarak hareket ettiği senaryolar olmak üzere, ajan yapay zeka kullanım durumları için özel olarak tasarlanmıştır. Bu tür karmaşık görevleri etkili bir şekilde yönetmek, açıklanan bellek iyileştirmelerinin paha biçilmez olduğu sağlam bir çalışma belleği gerektirir. Penn ayrıca şunları detaylandırdı:

“İşte burada bellek gibi temel unsurlar gerçekten önem kazanıyor, çünkü Claude'un kod tabanlarını ve büyük belgeleri keşfedebilmesi, ayrıca ne zaman geri dönüp bir şeyi yeniden kontrol etmesi gerektiğini bilmesi gerekiyor.”

Opus 4.5, 12 Kasım'da piyasaya sürülen OpenAI'nin GPT 5.1'i ve 18 Kasım'da tanıtılan Google'ın Gemini 3'ü gibi yakın zamanda piyasaya sürülen diğer öncü modellerle rekabetçi bir ortamda yerini alıyor.