Google’dan 16 GB RAM’li bilgisayarlara özel yapay zeka hamlesi

Yapay zeka modellerinin büyümesiyle birlikte bellek ve donanım ihtiyacı da hızla arttı. Bu durum, yerel olarak çalışan yapay zeka çözümlerini birçok kullanıcı için erişilmesi zor hale getirdi. Google ise bu soruna çözüm sunmayı hedefleyen yeni bir model duyurdu.

Şirket, Gemma 4 ailesine yeni eklenen Gemma 4 12B modelini tanıttı. Yeni model, performans ile donanım gereksinimi arasındaki boşluğu doldurmayı amaçlıyor.

Gemma 4 ailesine yeni üye

Google, nisan ayında Gemma 4 serisini yayınlamıştı. Seride mobil cihazlara yönelik E2B ve E4B modellerinin yanında daha büyük iş yükleri için geliştirilen 26B Mixture of Experts ve 31B Dense modelleri yer alıyordu.

Ancak bu iki uç nokta arasında önemli bir boşluk bulunuyordu. Gemma 4 12B tam da bu noktada devreye giriyor.

16 GB RAM ile çalışabiliyor

Google'a göre Gemma 4 12B, mobil sürümlere kıyasla daha güçlü bir yapıya sahip olmasına rağmen yüksek maliyetli yapay zeka hızlandırıcılarına ihtiyaç duymuyor.

Şirket, modelin 16 GB sistem belleği veya VRAM bulunan birçok tüketici dizüstü bilgisayarında çalışabildiğini belirtiyor. Bu da modeli, yerel yapay zeka çalıştırmak isteyen kullanıcılar için daha ulaşılabilir hale getiriyor.

Gemma 4 12B'nin bellek ihtiyacı, 26 milyar parametreli Gemma 4 26B MoE modelinin yaklaşık yarısı seviyesinde bulunuyor. Google ise performans açısından iki model arasındaki farkın beklenenden daha düşük olduğunu söylüyor.

Yeni tahmin sistemi hız kazandırıyor

Google, Gemma 4 12B'nin çok adımlı akıl yürütme süreçlerini ve gelişmiş yapay zeka görevlerini yerine getirebildiğini ifade ediyor.

Modelde ayrıca Multi-Token Prediction (MTP) adı verilen yeni bir sistem yer alıyor. Bu yapı, işlemcinin boşta kalan kaynaklarını kullanarak sonraki olası çıktıları önceden tahmin ediyor.

Böylece model daha hızlı yanıt verebiliyor ve kaynakları daha verimli kullanabiliyor. Google daha önce diğer Gemma 4 modelleri için de MTP sürümleri yayınlamıştı ancak bu teknoloji ilk kez bir modelde varsayılan olarak sunuluyor.

Görsel ve ses işlemede yeni yaklaşım

Gemma 4 ailesi metin, görüntü ve ses girişlerini destekleyen çok modlu bir yapıya sahip.

Diğer birçok yapay zeka modelinde görüntü ve ses verileri önce ayrı kodlayıcılar tarafından işleniyor, ardından dil modeline aktarılıyor. Bu yöntem ek bellek kullanımı ve gecikme oluşturabiliyor.

Google, Gemma 4 12B'de daha sade bir görüntü işleme sistemi kullandığını açıkladı. Yeni yapı sayesinde görüntü verileri doğrudan dil modeline aktarılabiliyor ve ek bir kodlayıcıya ihtiyaç duyulmuyor.

Ses tarafında ise süreç daha da sadeleşiyor. Şirket, ham ses sinyalini doğrudan metin verilerinde kullanılan vektörlere dönüştüren bir yöntem geliştirdiğini belirtiyor.

İndirilebilir sürüm de yayınlandı

Gemma 4 12B'yi denemek isteyenler modeli LM Studio, Google AI Edge Gallery ve benzeri platformlar üzerinden kullanabiliyor.

Yerel kullanım hedefleyen kullanıcılar için model dosyaları da yayınlandı. Gemma 4 12B'nin ağırlıkları şu anda Kaggle ve Hugging Face üzerinden indirilebiliyor. Modelin boyutu ise yaklaşık 18 GB seviyesinde bulunuyor.