Bu haftaya damga vuran yapay zeka araçları!
Piyasaya sunulan ya da geliştirildiği duyurulan yapay zeka servisleri her hafta bizleri şaşırtmaya devam ediyor. Haftanın en dikkat çekenlerini sizler için bir araya getirdik.
Teknoloji dünyasında her hafta yeni bir zeka sahneye çıkıyor! Her hafta, yapay zekânın sınırlarını zorlayan, işimizi kolaylaştıran ve hayal gücümüzü tetikleyen en dikkat çekici araçları mercek altına almaya çalışacağız. “Bir sonraki dijital devrim tam karşında olabilir” diyerek, sizi bu haftanın en çarpıcı yapay zeka keşiflerimizle başbaşa bırakıyoruz. Yeni araçlardan haberdar olmak için CHIP’i sık kullanılanlara eklemeyi unutmayın.
QWEN-IMAGE (https://github.com/QwenLM/Qwen-Image)
Bu yeni nesil 20B MMDiT’lik text2image modeli, kusursuz görsel içi
metinler, çoklu dil desteği ve çeşitli sanatsal stillerle çarpıcı
grafik posterler oluşturmada olağanüstü bir performans sergiliyor.
Testlerde, hem görüntü oluşturma hem de düzenleme konusunda güçlü
genel yetenekler sergiliyor ve özellikle Çince için metin işleme
konusunda olağanüstü bir performans gösteriyor. Mutlaka siteyi
ziyaret edip örnekleri kendiniz de görün.
YAN (https://greatx3.github.io/Yan/)
Tencent'in temel etkileşimli video oluşturma modeli Yan, dinamik,
etkileşimli video içeriği oluşturmada çıtayı yükseltiyor.
Etkileşimli video oluşturma için Yan, üç temel modülden oluşuyor:
Yan-Sim, Yan-Gen ve Yan-Edit. Özellikle, Yan-Sim etkileşimli video
ortamlarının yüksek kaliteli simülasyonunu mümkün kılıyor; Yan-Gen,
metin ve görüntüleri, etkileşimli videolar oluşturmak için prompt
olarak kullanıyo. Yan-Edit ise etkileşimli video içeriğinin çok
parçacıklı, gerçek zamanlı düzenlenmesini destekliyor.
MULE RUN (https://mulerun.com/)
Dünyanın ilk YZ Ajan pazarı olarak tanımlanabilir. Oyun ve
kodlamadan para kazanmaya kadar, Mule Run size sayısız YZ ajanına
erişim sağlıyor ve her zaman yeni ajanlar ekleniyor. Her gün
yenilenen 50 kredi ile sınırlı da olsa ücretsiz
kullanabilirsiniz.
MOLMOACT (https://allenai.org/blog/molmoact)
Bu uzamsal ortamlardaki hareketleri anlayan ve planlayan gelişmiş
bir eylem akıl yürütme modeli, karmaşık 3D alanlarda hassas
navigasyon, manipülasyon ve etkileşim sağlayabiliyor. Yani yapay
zeka ile robotlar arasında bir köprü oluyor. Açık kaynaklı dil
modeli Molmo üzerine inşa edilen MolmoAct, dil ve eylem arasındaki
boşluğu doldurarak makinelerin talimatları hassas bir şekilde takip
etmesini ve 3D alanda akıl yürütmesini sağlıyor. Üç boyutlu olarak
“düşünebilen” ilk model.
VOOST (https://nxnai.github.io/Voost/)
Sanal kıyafet deneme ve var olan kıyafetleri soyutlama işlemlerini
yüksek doğrulukla gerçekleştiren bu birleşik difüzyon dönüştürücü
moda için yapay zekayı her zamankinden daha esnek ve ölçeklenebilir
hale getiriyor. Sanal deneme, hedef giysiyi giyen bir kişinin
gerçekçi bir görüntüsünü sentezlemeyi amaçlıyor, ancak giysi-vücut
uyumunu doğru bir şekilde modellemek, özellikle poz ve görünüm
değişiklikleri altında, hala devam eden bir zorluk.
VERTEXREGEN (https://vertexregen.github.io/)
Tipik otoregresif yöntemlerin sınırlamalarını aşan yeni bir 3D mesh
oluşturma yaklaşımı. VertexRegen, eksik ağlar üretmek yerine, dizi
büyüdükçe ayrıntıları aşamalı olarak ekleyerek daha zengin ve daha
eksiksiz 3D modeller oluşturuyor. VertexRegen, en son teknoloji
yöntemlerle karşılaştırılabilir kalitede mesh’ler üretirken,
herhangi bir adımda durma esnekliği ile her an üretim imkanı
sunarak, farklı ayrıntı düzeylerinde geçerli mesh’ler
oluşturabiliyor. Low ploy modeller oluşturmak için büyük avantaj
sağlıyor.
DYAD (https://www.dyad.sh/)
Hızlı, yerel ve tamamen sizin kontrolünüzde, açık kaynaklı bir YZ
uygulama oluşturucu. Lovable, VO veya Bolt gibi, ancak doğrudan
kendi makinenizde çalışıyor. Tamamen ücretsiz. Dyad ile
uygulamanızı düzenlemek, değişiklikleri anında önizlemek ya da
gerçek zamanlı geri bildirimle adımları zahmetsizce geri almak
mümkün oluyor.
AFFOGATO AGENT (https://affogato.ai/)
Tam bir yapay zeka reklam video üretme yardımcısı. Herhangi bir
fikri dakikalar içinde sahneliyor, sesler ve düzenlemelerle tam
olarak üretilmiş bir videoya dönüştürüyor. Konseptten son kurguya,
her zamankinden daha hızlı sonuçlar oluşturabiliyor. İlk olarak
sıfırdan benzersiz YZ karakterleri tasarlayarak başlıyorsunuz.
Ardından görünümlerini, stillerini ve rollerini herhangi bir marka,
hikaye veya kampanyaya uyacak şekilde şekillendirdikten sonra YZ
ile çarpıcı ürün videoları hızlı ve zahmetsizce oluşturuluyor.
E-ticaret, Shopify ve moda pazarlaması için mükemmel.
GOOGLE DEEPMIND GENIE 3 (https://deepmind.google/discover/blog/genie-3-a-new-frontier-for-world-models/)
Etkileşimli, gerçek zamanlı ortamlar oluşturan bir yapay zeka olan
Genie 3,, bir metin komutu verildiğinde, 720p çözünürlükte birkaç
dakika boyunca tutarlılığı koruyarak, saniyede 24 kare hızında
gerçek zamanlı olarak gezinebileceğiniz dinamik dünyalar
oluşturabiliyor. Önemli bir dönüm noktası olarak görülen bu
gelişme, yapay zekayı genel yapay zekaya bir adım daha
yaklaştırıyor.
GOOGLE, GEMINI STORYBOOKS (https://gemini.google/overview/storybook/)
Google'ın Gemini Storybooks uygulaması, sesli anlatımlı,
kişiselleştirilmiş 10 sayfalık resimli hikayeler oluşturmanıza
olanak tanıyor. Değerli anılarınızı, özel şakalarınızı ve karmaşık
kavramları okuyabileceğiniz, dinleyebileceğiniz, yazdırabileceğiniz
ve paylaşabileceğiniz bir hikayeye dönüştürmek artık kolayca
mümkün. Yalnızca hikayenizi anlatın, Gemini onu hayata geçirmek
için özel sanat ve sesler oluşturuyor. Fotoğraflar, belgeler ve
dosyalardan da hikayeler oluşturabilirsiniz.