Teknoloji sektörünün önde gelen isimlerinden Adobe, yapay zeka modellerini eğitmek için telif hakkıyla korunan materyalleri kötüye kullandığı iddiasıyla bir toplu dava ile karşı karşıya. Şikayette, Firefly gibi kapsamlı yapay zeka hizmetleriyle tanınan yazılım devinin, SlimLM programını geliştirmek için korsan kitapları kullandığı iddia ediliyor ve bu durum, yapay zeka eğitim verilerinin gelişen ortamında önemli bir hukuki zorluğu daha işaret ediyor.

Oregonlu yazar Elizabeth Lyon adına açılan dava, Adobe'nin küçük bir dil modeli olan SlimLM programını hedef alıyor. Lyon, kendi telif hakkıyla korunan eserleri de dahil olmak üzere çok sayıda kitabın korsan versiyonlarının SlimLM için eğitim verisi olarak yasa dışı bir şekilde kullanıldığını iddia ediyor.

Adobe, SlimLM'yi "mobil cihazlarda belge destek görevleri" için tasarlanmış bir dizi küçük dil modeli olarak tanımlıyor. Şirket, SlimLM'nin Haziran 2023'te Cerebras tarafından yayınlanan "tekrarlanan verilerden arındırılmış, çoklu derlemli, açık kaynaklı bir veri kümesi" olan SlimPajama-627B üzerinde önceden eğitildiğini belirtti. Ancak, başlangıçta Reuters tarafından bildirilen Lyon'un davası, SlimPajama-627B'nin, tartışmalı Books3 koleksiyonunu içeren RedPajama veri kümesinin bir türevi olduğunu iddia ediyor. Şikayete göre bu, telif hakkıyla korunan kurgusal olmayan rehber kitaplarının SlimLM için kullanılan eğitim verilerinin bir parçası olduğu anlamına geliyor.

"Books3" veri kümesi — üretken yapay zeka sistemlerini eğitmek için sıkça kullanılan 191.000 kitaptan oluşan devasa bir koleksiyon — teknoloji endüstrisindeki telif hakkı anlaşmazlıkları için sürekli bir odak noktası olmuştur. SlimPajama'nın türetildiği iddia edilen RedPajama veri kümesi de birçok hukuki eyleme karışmıştır. Örneğin, Eylül ayında bir dava, Apple'ı, RedPajama'dan alınan veriler de dahil olmak üzere telif hakkıyla korunan materyalleri rıza veya tazminat olmaksızın Apple Intelligence modelini eğitmek için kullanmakla suçladı. Benzer şekilde, Salesforce da Ekim ayında RedPajama'yı eğitim amaçlı kullanımıyla ilgili benzer iddialarla bir dava ile karşı karşıya kaldı.

Bu hukuki zorluklar, algoritmaların genellikle korsan veya telif hakkıyla korunan içerik barındırdığı iddia edilen devasa veri kümelerine dayandığı yapay zeka endüstrisinde giderek yaygınlaşmıştır. Eylül ayında Anthropic, Claude sohbet robotunu eğitmek için eserlerinin korsan versiyonlarını kullandığı gerekçesiyle şirkete dava açan bir dizi yazara 1,5 milyar dolar ödemeyi kabul ettiğinde önemli bir emsal teşkil edildi. Bu uzlaşma, yapay zeka eğitim verileri ve fikri mülkiyet haklarıyla ilişkili artan hukuki risklerin altını çizdi.