Google, yapay zeka tabanlı ürünlerinde güvenlik açıklarını tespit etmeye yönelik yeni bir ödül programı başlattı. Program, özellikle yapay zeka kaynaklı hataları bulmayı ve raporlayan güvenlik araştırmacılarını teşvik etmeyi amaçlıyor.
Hedef: Tehlikeli yapay zeka eylemleri
Google’ın aradığı hatalar arasında, bir yapay zekâ komutunun dolaylı biçimde kötüye kullanılmasına yol açan örnekler bulunuyor.
Örneğin; Google Home’un kapıyı kilitsiz bırakmasına neden olan bir komut ya da bir kullanıcının e-postalarını özetleyip saldırgana gönderen bir veri sızdırma senaryosu bu kapsamda değerlendiriliyor.
Şirket, yeni programla birlikte bir “AI hatası”nın ne olduğunu daha net biçimde tanımladı. Buna göre, büyük dil modelleri veya üretken yapay zekâ sistemleri üzerinden zarara yol açan veya güvenlik açıklarını istismar eden durumlar bu kategoriye giriyor.
Güvenliği tehdit eden davranışlara odaklanılıyor
Bu tür hatalar arasında, bir kullanıcının hesabının veya verilerinin izinsiz şekilde değiştirilmesi, güvenliğinin zayıflatılması ya da istenmeyen işlemlerin gerçekleştirilmesi öne çıkıyor.
Geçmişte keşfedilen bir örnekte, Google Takvim’e yerleştirilen zararlı bir etkinlik, akıllı panjurları açıp ışıkları kapatabiliyordu.
İki Yılda 430.000 dolar kazanıldı
Google, yapay zekâ sistemlerindeki potansiyel zafiyetleri bulmaları için araştırmacıları teşvik etmeye iki yıl önce başladı. O günden bu yana hata avcıları 430.000 doların üzerinde ödül kazandı.
Ancak şirket, yalnızca Gemini gibi modelleri “halüsinasyon”a zorlamanın ödül için yeterli olmadığını belirtiyor.
Nefret söylemi veya telif hakkı ihlali gibi içerik üretimiyle ilgili hatalar ise, ürün içindeki geri bildirim kanallarına raporlanmalı.
Google’a göre bu yöntem, yapay zekâ güvenlik ekiplerinin modeli uzun vadeli eğitimlerle daha güvenli hale getirmesini sağlıyor.
Yeni araç: CodeMender
Google, yeni ödül programıyla birlikte CodeMender adında bir yapay zekâ aracını da duyurdu.
Bu araç, güvenlik açığı barındıran kodları otomatik olarak onarıyor. Şirketin açıklamasına göre, insan denetimi sonrasında 72 açık kaynak projesine ait güvenlik düzeltmesi CodeMender tarafından başarıyla yapıldı.
Ödül detayları
Google, arama motoru (Search), Gemini uygulamaları ve Workspace araçları (Gmail, Drive gibi) üzerinde tespit edilen kritik güvenlik açıkları için 20.000 dolar ödül veriyor.
Rapor kalitesine ve keşfin özgünlüğüne göre bu miktar 30.000 dolara kadar çıkabiliyor.
Diğer ürünlerde, örneğin Jules veya NotebookLM gibi uygulamalarda bulunan açıklar ise daha düşük ödül kapsamında değerlendiriliyor.