DeepSeek Yeni Yapay Zeka Modelini Google Gemini ile mi Eğitti?

Çinli yapay zeka laboratuvarı DeepSeek, yakın zamanda matematik ve kodlamada geliştirilmiş performans sunan güncellenmiş bir R1 muhakeme modeli yayınladı. Ancak, şirketin eğitim verisi kaynağı konusundaki sessizliği spekülasyonlara yol açtı. Bazı yapay zeka araştırmacıları, DeepSeek'in Google'ın Gemini yapay zeka ailesini kullandığından şüpheleniyor.

Kanıtlar Gemini'yi İşaret Ediyor

Geliştirici Sam Paeach, DeepSeek'in R1-0528 modelinin Google'ın Gemini 2.5 Pro'suna benzer dilsel kalıplar sergilediğini iddia ediyor. Bulgularını X'te (eski adıyla Twitter) paylaştı:

Yeni deepseek r1'in neden biraz farklı geldiğini merak ediyorsanız, bence muhtemelen sentetik openai'den sentetik gemini çıktılarını eğitmeye geçtiler. pic.twitter.com/Oex9roapNv

— Sam Paeach (@sam_paech) 29 Mayıs 2025

Başka bir geliştirici, DeepSeek'in modelinin "düşünce" süreçleri ile Gemini arasındaki benzerliklere dikkat çekerek bu teoriyi destekliyor.

Geçmişteki Suçlamalar ve Endüstri Kaygıları

Bu, DeepSeek'in rakip verileri üzerinde eğitim yaptığı suçlamalarıyla karşı karşıya kaldığı ilk sefer değil. Önceki örnekler, OpenAI ve Microsoft tarafından soruşturmalara yol açan OpenAI'nin ChatGPT'sini içeriyordu. Bu olaylar, daha küçük modellerin daha büyük ve daha güçlü modellerden çıkarılan veriler kullanılarak eğitildiği bir teknik olan veri damıtma konusundaki artan endişeyi vurguluyor.

Damıtma doğası gereği yasak olmasa da, OpenAI'nin hizmet şartları, rakip yapay zeka geliştirmek için model çıktılarını kullanmayı yasaklıyor.

Yapay Zeka Veri Kirliliğinin Zorluğu

Çevrimiçi olarak yapay zeka tarafından oluşturulan içeriğin artan yaygınlığı, eğitim veri kümelerini etkili bir şekilde filtrelemeyi zorlaştırıyor. Bu "kirlilik", eğitim verilerinin kaynağını belirlemeyi zorlaştırıyor.

Ancak, AI2'den Nathan Lambert gibi yapay zeka uzmanları, DeepSeek'in kaynakları ve potansiyel faydaları göz önüne alındığında Gemini verilerini kullanmasının makul olduğuna inanıyor:

DeepSeek olsaydım, kesinlikle piyasadaki en iyi API modelinden bir ton sentetik veri oluştururdum. GPU'ları az ve nakit paraları bol. Bu onlar için kelimenin tam anlamıyla daha fazla işlem gücü demek. Gemini damıtma sorusuna evet.

— Nathan Lambert (@natolambert) 3 Haziran 2025

Yapay Zeka Şirketleri Güvenlik Önlemlerini Artırıyor

Verilerin kötüye kullanımıyla mücadele etmek için yapay zeka şirketleri güvenliği güçlendiriyor. OpenAI artık Çin gibi ülkeleri hariç tutarak gelişmiş model erişimi için kimlik doğrulaması gerektiriyor. Google ve Anthropic, modellerini ve rekabet avantajlarını korumak için iz özetlemeyi uyguladı.

Yorum için Google ile iletişime geçildi.