Google Gemini API, Maliyet Tasarrufu için Örtük Önbelleklemeyi Sunuyor

Google, en yeni yapay zeka modelleri Gemini 2.5 Pro ve 2.5 Flash'ı kullanan geliştiriciler için maliyetleri düşürmeyi amaçlayan Gemini API'si için "örtük önbellekleme"yi kullanıma sundu. Bu özellik, API aracılığıyla iletilen tekrarlayan içeriklerde %75'e varan tasarruf vaat ediyor.

Gelişmiş yapay zeka modellerini kullanmanın artan maliyeti, geliştiriciler için bir endişe kaynağı olmuştur. Google'ın örtük önbelleklemesi, sık erişilen verileri yeniden kullanarak hesaplama yükünü ve ilgili giderleri azaltarak bu sorunu ele alıyor.

Gemini API'sinde örtük önbelleklemeyi kullanıma sunduk ve isteğiniz önbelleğe isabet ettiğinde Gemini 2.5 modelleriyle otomatik olarak %75 maliyet tasarrufu sağlıyoruz.

Ayrıca, önbelleğe isabet etmek için gereken minimum token sayısını 2.5 Flash'ta 1K'ya ve 2.5 Pro'da 2K'ya düşürdük!

Logan Kilpatrick (@OfficialLoganK) 8 Mayıs 2025

Önbellekleme, yapay zekada yaygın bir uygulamadır, ancak Google'ın önceki "açık önbelleklemesi", geliştiricilerin sık kullanılan istemleri manuel olarak tanımlamasını gerektiriyordu. Bu yeni örtük önbellekleme otomatiktir, süreci basitleştirir ve varsayılan olarak maliyet tasarrufu sağlar.

Google, bir Gemini 2.5 modeline yapılan bir isteğin önceki isteklerle ortak bir öneke sahip olması durumunda, bir önbellek isabetine uygun olduğunu ve bunun sonucunda geliştiriciye maliyet tasarrufu sağlandığını açıklıyor. Önbellekleme için minimum token sayısı 2.5 Flash için 1.024 ve 2.5 Pro için 2.048'dir, bu da nispeten düşük bir eşiktir.

Açık önbellekleme ve maliyet tahminleriyle ilgili geçmiş sorunların ardından Google, geliştiricilere önbellek isabetlerini en üst düzeye çıkarmak için tekrarlayan içeriği isteklerin başına yerleştirmelerini önerir. Dinamik içerik sona eklenmelidir.

Google, vaat edilen tasarrufların üçüncü taraf doğrulamasını sağlamamış olsa da, örtük önbelleklemenin otomatik yapısı, Gemini API'sini kullanan geliştiriciler için potansiyel olarak önemli bir maliyet azaltma imkanı sunuyor. Erken benimseyenlerin geri bildirimleri, gerçek etkinliğini değerlendirmede çok önemli olacaktır.

Örtük önbellekleme hakkında daha fazla bilgi Google'ın blog gönderisinde ve geliştirici dokümantasyonunda bulunabilir.