OpenAI, ChatGPT görüntü oluşturma yeteneklerine önemli bir yükseltme olan GPT-Image-1.5'i piyasaya sürdü. Bu yeni sürüm, dört kata kadar daha hızlı görüntü oluşturma, üstün talimat takibi ve daha hassas düzenleme vaat ediyor. Bu lansman, özellikle OpenAI CEO'su Sam Altman'ın dahili bir notta yaptığı son "kırmızı kod" açıklamasının ardından, Google ile yaşanan şiddetli yapay zeka rekabetinde kritik bir tırmanışı işaret ediyor.
Yapay Zeka Ortamında Kızışan Rekabet
Bu sürüm, OpenAI'ın geçen ay Altman'dan gelen ve Google'ın artan hakimiyetine karşı koyma planlarını özetleyen dahili bir notun ardından pazar liderliğini yeniden kazanmak için agresif bir hamle yapmaya devam ettiği bir zamanda geldi. Google, amiral gemisi modeli Gemini 3'ü ve viral görüntü oluşturucusunun en son sürümü Nano Banana Pro'yu piyasaya sürerek önemli pazar payı elde etmişti. Her iki model de çeşitli kıyaslamalarda LMArena liderlik tablosunda dikkat çekici bir şekilde zirveye yerleşti.
OpenAI'ın geçen hafta, GPT-5.2'nin lansmanı ile yaptığı karşı hamleye rağmen –ki bu model geliştiriciler ve günlük profesyonel kullanım için şimdiye kadarki en gelişmiş modeli olarak tanıtıldı– Google liderliğini korudu. OpenAI'ın, yoğunlaşan rekabete yanıt vermek amacıyla başlangıçta Ocak ayı başı için planlanan GPT-Image-1.5 sürümünü hızlandırdığı bildirildi. Önceki görüntü modeli olan GPT-Image-1, Nisan ayında piyasaya sürülmüştü.
GPT-Image-1.5: Gelişmiş Özellikler ve Kullanıcı Deneyimi
GPT-Image-1.5, yapay zeka görüntü ve video oluşturucularının prototiplerden üretime hazır araçlara hızla evrildiği bir zamanda geliyor. Google'ın Nano Banana Pro'suna benzer şekilde, ChatGPT Görselleri artık gelişmiş post prodüksiyon özellikleri sunuyor. Bunlar, yüz benzerliğini, aydınlatmayı, kompozisyonu ve renk tonunu koruma gibi düzenlemeler arasında görsel tutarlılık sağlayan ayrıntılı düzenleme kontrollerini içeriyor.
Bu yetenek, birçok üretken yapay zeka görüntü aracının tekrarlayan düzenlemelerde zorlandığı göz önüne alındığında önemli bir ileri adımı temsil ediyor. Genellikle, kullanıcılar 'yüz ifadesini ayarla' veya 'aydınlatmayı daha soğuk yap' gibi belirli bir değişiklik talep ettiğinde, mevcut modeller tüm görüntüyü yeniden yorumlama eğilimindedir, bu da sinir bozucu bir tutarlılık eksikliğine yol açar. GPT-Image-1.5, hassas görsel ayarlamalar için geliştirilmiş talimat takibini gösteren örneklerle kanıtlandığı gibi, bu temel zorluğu çözmeyi hedefliyor.
Daha Görsel ve Sezgisel Bir ChatGPT
Teknik geliştirmelerinin ötesinde, güncelleme aynı zamanda yenilenmiş bir kullanıcı deneyimi de sunuyor. ChatGPT Görselleri, Salı günü bir blog yazısında belirttiği üzere, OpenAI'ın Uygulamalardan Sorumlu CEO'su Fidji Simo'ya göre "daha çok bir yaratıcı stüdyo gibi" işlev görecek şekilde tasarlanmış, ChatGPT kenar çubuğunda özel bir giriş noktası aracılığıyla artık erişilebilir.
"Yeni görüntü görüntüleme ve düzenleme ekranları, vizyonunuza uygun görüntüler oluşturmayı veya trend olan istemlerden ve ön ayarlı filtrelerden ilham almayı kolaylaştırıyor," diye yazdı Simo.
OpenAI'ın daha geniş vizyonu, ChatGPT deneyimine daha fazla görsel öğe entegre etmeyi ve arama sorgularının net kaynaklarla daha zengin görseller göstermesini hedefliyor. Simo'ya göre bu, birim dönüştürme veya spor skorlarını kontrol etme gibi görevlere fayda sağlayabilir.
"Yaratırken, yaptığınız şeyi görebilmeli ve şekillendirebilmelisiniz. Görseller tek başına kelimelerden daha iyi bir hikaye anlattığında, ChatGPT bunları içermeli," diye vurguladı Simo. "Hızlı bir cevaba veya bir sonraki adımın başka bir araçta olmasına ihtiyacınız olduğunda, tam orada olmalı. Bunu yaparken, zihninizdeki ile onu hayata geçirme yeteneğiniz arasındaki mesafeyi kapatmaya devam edebiliriz."








