Bir zamanlar profesyonel yeterlilikten uzak görülen yapay zeka ajanları, önemli bir atılım gerçekleştirdi. Anthropic'in yakın zamanda piyasaya sürdüğü Opus 4.6 modeli, özellikle hukuki ve kurumsal analiz gibi karmaşık profesyonel görevlerde Mercor tarafından belirlenen performans kıyaslamalarını dramatik bir şekilde yeniden şekillendirdi. Bu hızlı ilerleme, daha önce güvenli olduğu düşünülen mesleklerde yapay zekanın yer değiştirme sürecinin hızlanabileceğini gösteriyor.
Daha geçen ay, Mercor tarafından yapılan yeni bir kıyaslama, yapay zeka ajanlarının yeteneklerini çeşitli profesyonel görevlerde ölçtü. O zamanlar, büyük yapay zeka laboratuvarlarının %25'in altında puan almasıyla skorlar dikkat çekici derecede düşüktü. Bu durum, örneğin avukatların yakın zamanda yapay zeka tarafından yerinden edilme riskinden güvende olduğu yönünde bir fikir birliğine yol açtı.
Ancak, yapay zeka gelişiminin hızı şaşırtıcı derecede hızlı olabilir. Bu hafta Anthropic'in Opus 4.6'yı piyasaya sürmesi, yapay zeka ajanı liderlik tablolarını önemli ölçüde sarstı. Anthropic'in yeni modeli, tek denemede yaklaşık %30 ve sorunları çözmek için birden fazla deneme yapıldığında etkileyici bir %45 başarı elde etti. Bu iyileşmedeki temel bir faktör, çok adımlı problem çözmeyi geliştirmek için tasarlanmış "ajan sürüleri" gibi yeni ajansal özelliklerin dahil edilmesi gibi görünüyor.
Bu skor, önceki en son teknolojiden önemli bir sıçramayı temsil ediyor ve temel modellerdeki ilerlemenin yavaşlamadığını gösteriyor. Mercor CEO'su Brendan Foody, şaşkınlığını dile getirerek şunları belirtti:
"Birkaç ay içinde %18,4'ten %29,8'e sıçramak akıl almaz bir şey."
%30 veya %45'lik bir skor hala %100'den oldukça uzak olsa da, bu durum avukatların gelecek hafta makineler tarafından yerinden edilmeyeceği anlamına geliyor, ancak hızlı ilerleme inkar edilemez. Çeşitli alanlardaki profesyoneller, özellikle hukuk alanındakiler, yapay zeka tarafından yerinden edilmeye karşı bağışıklıklarına bir ay öncesine göre artık önemli ölçüde daha az güven duymalıdır.







