Bir yapay zeka mucizesi daha: Microsoft'un VASA-1'i, fotoğrafları konuşturmaya başladı

Microsoft, herhangi birinin fotoğrafını gerçekten konuşturan, VASA-1 ismini verdiği etkileyici bir yapay zeka teknolojisi geliştirdiğini duyurdu.

Bir yapay zeka mucizesi daha: Microsoft, fotoğrafları konuşturmaya başladı

Microsoft’un en son üretken yapay zeka ürünü VASA-1, inanılmaz bir başarıya imza attı ve tek bir görsel ile bir ses dosyasını birleştirerek görseldeki kişinin konuşuyor gibi göründüğü bir video yaratma yeteneğini kazandı. Ayrıca bu videoda, ses dosyasına uygun bir şekilde hareket eden tek şey görseldeki kişinin ağzı değil, yüz ifadelerinden kafa hareketlerine kadar görselin tamamı tam bir konuşmacıya dönüşüyor.

Üretken AI’nin ses ve görsel alanında attığı muazzam adımlar düşünülürse, bu noktaya ulaşmamız kaçınılmaz gibi gözüküyordu. Örneğin bu yılın ilerleyen dönemlerinde genel kullanıma sunulması beklenen OpenAI’nin Sora’sı, gösterim etkinliklerinde kendi inanılmaz yazıdan videoya dönüştürme yeteneklerini gösterdi. Ayrıca OpenAI, sadece birkaç saniye dinledikten sonra herhangi birinin sesi kopyalayabilen bir AI teknolojisi de geliştirdi.

Elbette herhangi birinin fotoğrafı ile istediğiniz herhangi bir konuşmayı birleştirebildiğiniz bir teknoloji, etkileyici olduğu kadar tehlikeli de olabilir. Bu tür bir teknoloji, çok kolay bir şekilde yanlış bilgi yaymak, birinin itibarını lekelemek ve muhtemelen daha pek çok kötü amaç için kullanılabilir. Neyse ki Microsoft, VASA-1’in ChatGPT veya Copilot gibi kamuya açık bir ürün olmayacağını belirtiyor ve yakın gelecekte VASA-1’i ticarileştirme planı olmadığını söylüyor.

Ayrıca Microsoft’un VASA-1 çerçevesini test etmek için kullandığı görsellerin (neredeyse) tamamı da StyleGAN2 veya Dall-E 3 gibi AI ürünleri tarafından oluşturulan sanal kişilerden oluşuyor. Microsoft’un bu testlerde kullandığı tek “ünlü” örnek ise Mona Lisa tablosu.

Microsoft’un vurguladığı üzere VASA-1 şu anda sadece bir araştırma projesi olarak geliştiriliyor ve bu kavram kanıtı, böyle bir AI işlevinin mümkün olduğunu gösteriyor.

Son bir not olarak Microsoft, gelecekte bu teknolojiyi ticari bir ürüne dönüştürmesinin mümkün olabileceğini söylüyor ancak sadece “teknolojinin sorumlu ve uygun düzenlemelerle uyumlu bir şekilde kullanılacağından emin olduktan sonra" böyle bir adım atacağını belirtiyor.