Web Summit Katar'da, ElevenLabs kurucu ortağı ve CEO'su Mati Staniszewski, sesin yapay zeka için birincil arayüz olmaya hazır olduğunu ve insanların makinelerle etkileşimini temelden değiştireceğini belirtti. ElevenLabs gibi gelişmiş ses modellerinin artık büyük dil modellerinin muhakeme yetenekleriyle entegre olduğunu, sadece konuşma taklidinin ötesine geçerek daha doğal ve sofistike konuşma tabanlı yapay zekayı mümkün kıldığını vurguladı.
Staniszewski, akıllı telefonların ceplerde kaldığı, bireylerin kendilerini tamamen gerçek dünyaya kaptırdığı ve sesin teknolojiyi kontrol etmek için sezgisel bir mekanizma olarak hizmet ettiği bir gelecek öngörüyor.
Bu iddialı vizyon, ElevenLabs'ı yakın zamanda başarılı bir 500 milyon dolarlık finansman turuna taşıdı ve şirketin değerini 11 milyar dolara çıkardı. Bu görüş, yapay zeka endüstrisinde geniş çapta yankı buluyor; OpenAI ve Google gibi devler, yeni nesil modellerinde sese öncelik veriyor. Apple'ın da stratejik satın almalar yoluyla sese yakın, her zaman açık teknolojileri geliştirdiği bildiriliyor. Yapay zeka giyilebilir cihazlara, araçlara ve diğer yeni donanımlara doğru genişledikçe, ses kontrolü kritik bir savaş alanı olarak ortaya çıkıyor ve etkileşimi geleneksel ekranlardan uzaklaştırıyor.
Iconiq Capital Genel Ortağı Seth Pierrepont, Web Summit sahnesinde bu bakış açısını pekiştirerek, ekranların oyun ve eğlence için hayati önemini koruyacağını ancak klavyeler gibi geleneksel giriş yöntemlerinin "eskimeye" başladığını öne sürdü.
Hem Staniszewski hem de Pierrepont, modellerin kalıcı bellek, bağlam ve entegrasyonlar geliştireceği "ajanik" yapay zeka sistemlerine doğru kayışı vurguladı. Bu evrim, yapay zeka ihtiyaçları tahmin edip akıllıca yanıt verdikçe kullanıcılardan daha az açık komut istemi gerektiren daha doğal etkileşimlere olanak tanıyacak.
Bu teknolojik ilerleme, dağıtım stratejilerini de etkileyecek. Yüksek kaliteli ses modelleri geleneksel olarak bulutta bulunurken, Staniszewski ElevenLabs'ın bulut ve cihaz içi işlemeyi birleştiren hibrit bir yaklaşım izlediğini belirtti. Bu strateji, kulaklıklar ve diğer giyilebilir cihazlar gibi gelişmekte olan donanımları desteklemeyi, sesi isteğe bağlı bir özellikten ziyade sürekli, sorunsuz bir arkadaşa dönüştürmeyi amaçlıyor.
ElevenLabs, Meta ile zaten bir ortaklık kurarak ses teknolojisini Instagram ve sanal gerçeklik platformu Horizon Worlds gibi ürünlerine entegre etti. Staniszewski, sesle çalışan arayüzler çeşitli form faktörlerine yayıldıkça Meta'nın Ray-Ban akıllı gözlükleri de dahil olmak üzere daha fazla işbirliğine açık olduğunu ifade etti.
Ancak, ses teknolojisinin günlük donanımlarda artan yaygınlığı önemli gizlilik endişelerini beraberinde getiriyor. Özellikle kullanıcıların günlük yaşamlarına daha derinlemesine entegre oldukça, ses tabanlı sistemler tarafından toplanan kişisel bilgilerin kapsamı, gözetim ve veri depolama konularında sorular ortaya çıkıyor. Bu sorun daha önce Google gibi şirketlere, kullanıcı verilerinin kötüye kullanıldığı iddialarıyla suçlamalara yol açmıştı.







