Apple, yapay zekaya 'insan gibi düzenleme yapmayı" nasıl öğrettiğini açıkladı
Metinle görsel düzenleme yeteneğini artırdığını söyleyen Apple, Nano-Banana ve Gemini-2.5-Pro'yu kullanarak AI çalışmalarını derinleştiriyor. Şirket, kullanıcıların "nesne ekle" gibi doğal isteklerini anlayan ve uygulayan daha güçlü araçlara sahip olmak için zorlu testler yapıyor.
Apple, yapay zeka alanındaki çalışmalarına dair yeni bir makale yayınlayarak, AI’yi tıpkı bir insan gibi görsel düzenlemeler yapması için nasıl eğittiğini anlattı. “Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing, - Pico-Banana-400K: Metin Kılavuzlu Görsel Düzenleme için Büyük Ölçekli Bir Veri Seti” başlıklı makale, şirketin, cihaz üzerinde çalışan AI yeteneklerini artırma çabalarını gösteriyor.
Bu çalışma, özellikle Siri'nin gelecekte görselleri kırpma, renk dengesi ayarlama gibi düzenleme komutlarını anlayıp uygulayabileceği yönündeki beklentilerle yakından ilişkili görülüyor. Apple’ın bu yeni çalışmasının temelinde, yaklaşık 400.000 yüksek kaliteli örnek içeren metin destekli görüntü düzenleme veri seti bulunuyor. Araştırmacılar, bu devasa veri setini oluşturmak ve doğrulamak için çeşitli AI modellerini bir araya getirdiklerini söylüyor:
Nano-Banana: Görüntü düzenlemelerini gerçekleştiren yeni model.
Gemini-2.5-Flash: Düzenleme talimatlarını metin olarak oluşturan model.
Gemini-2.5-Pro: Yapılan düzenlemelerin kalitesini değerlendiren model.
Bu kapsamlı çalışma, renk ve stil değiştirme, nesne ekleme veya çıkarma gibi tam 35 ayrıntılı düzenleme türü üzerinde yapılandırılmış.
Apple araştırmacıları, gerçek görseller kullanarak ve güçlü bir değerlendirme modeli aracılığıyla titiz bir filtreleme uygulayarak, büyük ölçekli ve yüksek kalitede düzenlemelerin mümkün olduğunu kanıtladıklarını söylüyorlar. Test sonuçları, stil düzenlemelerinin en güvenilir AI deneyimini sunduğunu gösterirken, nesneleri taşımak ve metinleri değiştirmek gibi daha karmaşık düzenlemelerde hala büyük bir başarı oranı yakalanmadığını gösteriyor.
Apple Intelligence ve görsel düzenlemenin geleceği
Apple, zaten Clean Up ve Image Playground gibi temel AI destekli düzenleme araçları sunuyor. Ancak Google ve Samsung gibi rakiplerinin aksine, AI destekli görsel düzenleme konusunda şimdiye kadar çok büyük bir adım atmadı. Bu makale, Apple’ın bu alana daha fazla yatırım yapmak istediğini açık bir şekilde gösteriyor.
Şirketin bu veri setini, gelecekteki çok modlu (çoklu veri türünü anlayan) modellerini eğitmek veya mevcut modelleri ince ayar yapmak için kullanması bekleniyor. Ayrıca bu set, yeni AI modellerinin görüntü düzenleme hassasiyetini değerlendirmek için standart bir ölçüt olarak da kullanılabilir. Eğer Apple bu çalışmasını geliştirmeye devam ederse, kullanıcılar Siri'ye veya diğer AI asistanlarına doğal dilde talimat vererek daha güçlü ve sezgisel görüntü düzenleme araçlarına sahip olabilirler.
Apple’ın uzun zamandır beklenen yenilenmiş Siri'yi önümüzdeki yılın başlarında kullanıma sunması bekleniyor. Bu ilk aşamada kişisel asistanın “ekran farkındalığına” ve cihaz üzerindeki verileri daha iyi arama yeteneğine sahip olması beklenirken, bu yeni görsel düzenleme yetenekleri de Apple Intelligence kapsamında kademeli olarak hayatımıza girebilir.