Google Arama Uzmanı John Mueller, yalnızca büyük dil modelleri (LLM'ler) için özel Markdown veya JSON sayfaları oluşturma eğilimine şüpheyle yaklaştığını belirtti. Mueller, insan kullanıcılar tarafından görülmeyen içerik formatları oluşturmanın gerekliliğini sorgulayarak, içerik oluşturucular için temiz HTML ve yapılandırılmış verilerin birincil odak noktası olması gerektiğini vurguladı.
Tartışma, SEO uzmanı Lily Ray'in Bluesky'de "LLM'ler için ayrı markdown / JSON sayfaları oluşturup bu URL'leri botlara sunma" hakkında bir soru yöneltmesi ve Google'ın resmi bakış açısını sormasıyla başladı. Bu soru, yayıncıların içeriklerinin yapay zeka sistemleri tarafından daha kolay sindirileceğine inanılan formatlarda "gölge" kopyalarını oluşturduğu gelişmekte olan bir uygulamayı vurguluyor.
Cevaplayabilir misiniz bilmiyorum ama LLM'ler için ayrı markdown / JSON sayfaları oluşturup bu URL'leri botlara sunma hakkında çok şey duymaya başladım. Google'ın bu konudaki bakış açısını paylaşabilir misiniz?
Ray ayrıca, bunun "sıcak bir konu" haline geldiğini ve şirketlerin bu tür yapay zekaya özel içerik versiyonları oluşturmak için aktif olarak çözümler sunduğunu belirtti. Bu konuyla ilgili daha aktif bir tartışma X'te (eski adıyla Twitter) de yaşandı.
Mueller'in Yalnızca LLM'lere Yönelik Sayfalar Konusundaki Durumu
Ray'in sorusuna yanıt olarak Mueller, böyle bir kurulumu gerektirecek herhangi bir dahili Google şartnamesinden haberdar olmadığını belirtti. LLM'lerin başlangıcından bu yana standart web sayfaları üzerinde başarıyla eğitildiğini ve bunları ayrıştırdığını vurguladı.
Bu konuda herhangi bir şeyden haberdar değilim. Benim bakış açıma göre, LLM'ler başlangıçtan beri normal web sayfaları üzerinde eğitildi – okudu ve ayrıştırdı – ve HTML ile başa çıkmakta sorun yaşamadıkları aşikar. Neden hiçbir kullanıcının görmediği bir sayfayı görmek istesinler ki? Ve eğer eşdeğerliği kontrol ediyorlarsa, neden HTML kullanmasınlar?
Ray, ayrı bir formatın "anahtar noktaları LLM'lere hızlı bir şekilde ulaştırmayı hızlandırıp hızlandırmayacağını" sorduğunda, Mueller, belirli dosya formatlarının önemli bir fark yaratması durumunda, bu yapay zeka sistemlerini geliştiren ve çalıştıran şirketlerin bu konuda çok sesli olacaklarını savundu.
Bu sistemleri oluşturan ve çalıştıranlar, belirli dosya formatlarına sahip sitelerden daha iyi yanıtlar oluşturabileceklerini bilselerdi, bu konuda çok sesli olacaklarını tahmin ediyorum. Yapay zeka şirketleri utangaçlıklarıyla pek bilinmezler.
Bazı sayfaların yapay zeka sistemleri için diğerlerinden daha iyi performans gösterebileceğini kabul etti, ancak bunun öncelikle dosya formatının kendisinden, özellikle HTML ve Markdown arasındaki farktan kaynaklandığından şüphe duydu. Ayrıca, JavaScript içeriğinin birçok yapay zeka sistemi için hala zorluklar yarattığını belirtti.
Mueller'in yorumları topluca, Google'ın bakış açısından, yayıncıların yalnızca LLM'lerin anlayışını sağlamak amacıyla mevcut sayfaların yalnızca botlara yönelik Markdown veya JSON kopyalarını oluşturmaları için acil bir ihtiyaç olmadığını gösteriyor.
Yapılandırılmış Verinin Rolü
Tartışmaya katkıda bulunan diğer kişiler, spekülatif "gölge" formatlar ile yapay zeka platformlarının açıkça tanımlanmış içerik gereksinimlerine sahip olduğu durumlar arasında ayrım yaptı. Örneğin Matt Wright, OpenAI'ın e-ticaret ürün akışlarını JSON şemalarının kritik olduğu bir durum olarak vurguladı.
Bu tür bağlamlarda, kesin bir spesifikasyon, ChatGPT gibi platformların ürün verilerini nasıl alıp görüntüleyeceğini belirler. Wright açıkladı:
İlginç bir şekilde, OpenAI e-ticaret ürün akışları yayında: JSON şemaları, yapay zeka aramasında şimdiden önemli bir role sahip gibi görünüyor.
Bu örnek, bir platform açıkça bir spesifikasyon yayınladığında ve kullanımını gerektirdiğinde yapılandırılmış akışların ve şemaların çok önemli hale geldiği fikrini desteklemektedir. Ek olarak, Chris Long LinkedIn'de "ürün şemaları kullanan editoryal sitelerin ChatGPT alıntılarına dahil edilme eğiliminde olduğunu" gözlemleyerek, belirli, iyi tanımlanmış senaryolarda yapılandırılmış verinin değerini daha da vurguladı.
Bu Neden Yayıncılar ve SEO Uzmanları İçin Önemli?
İçeriklerinin "LLM'ler için optimize edilmiş" Markdown veya JSON versiyonlarını geliştirmeyi düşünen yayıncılar ve SEO profesyonelleri için bu tartışma değerli bir rehberlik sunuyor. Mueller'in açıklamaları, LLM'lerin standart HTML'i etkili bir şekilde okuma ve ayrıştırma konusundaki uzun süredir devam eden yeteneğini pekiştiriyor.
Çoğu web sitesi için daha verimli bir yaklaşım, mevcut sayfaların hızını, okunabilirliğini ve genel içerik yapısını sürekli olarak iyileştirmeyi içerir. Özellikle açık platform yönergeleri veya spesifikasyonları mevcut olduğunda şema işaretlemesi uygulamak da faydalıdır.
Bluesky tartışması, ürün akışları gibi niş alanlarda yapay zekaya özel formatların ortaya çıktığını gösterse de, bunlar genellikle Markdown'ın LLM'ler için doğası gereği üstün olduğu genel bir kuraldan ziyade açık entegrasyonlara bağlıdır. Bu özel gereksinimleri kesinlikle takip etmeye değer.
Geleceğe Bakış
Bu konuşma, yapay zeka odaklı arama değişikliklerinin, genellikle kapsamlı dokümantasyondan önce, SEO ve geliştirme ekipleri için teknik taleplere dönüşme hızını vurguluyor. LLM sağlayıcıları daha somut yönergeler yayınlayana kadar, mevcut tavsiye temel en iyi uygulamalara geri dönüyor:
- Temiz HTML kullanın.
- Gereksiz JavaScript'i azaltın, özellikle içerik ayrıştırmayı engellediği yerlerde.
- Platformların açıkça belgelenmiş şemaları olduğu yerlerde yapılandırılmış veri kullanın.
Bu ilkelere bağlı kalarak, içerik oluşturucular materyallerinin hem insan kullanıcılar hem de gelişmiş yapay zeka sistemleri için erişilebilir ve anlaşılır kalmasını sağlayabilirler.









