Google'ın Yapay Zekası, Bizim Kadar Bencil!

Bilgisayarlar için imkansız bir şey olan tarihi strateji oyunu Go'nun ustası haline gelmesi ile ünlenen Google'ın DeepMind programı, bu günlerde biraz daha farklı bir şey üzerinde oynamakta: Sosyal ikilemler.

Yapay zeka (AI) kolu, AI'lerin ortak bir kazanç için beraber çalışmayı öğrenip öğrenemeyeceklerini görmek için oyun teorisi senaryolarını test ettiler.

DeepMind'ın bir blog yazısında yazdığı üzere bu tür sosyal deneyler için daha ünlü olan "oyunlardan" biri Prisoner's Dilemma (Mahkumun İkilemi) olmakta ve bu oyunda iki suçlu, serbest kalmak için arkadaşlarını "satmak" veya daha düşük bir ceza süresi için sessiz kalma riskini tercih etmeleri gerekiyor.

Tabii ki DeepMind ekibi, bir bilgisayarı hapse atmak yerine, bu "rekabet veya ortak çalışma" ikilemlerini yakın bir şekilde taklit eden iki oyun buldular.

DeepMind'ın bu kavramları test ettiği ilk oyun "Gathering" adına sahip. Bu oyunda her AI, kırmızı ve mavi pikseller olarak gözükenler, elmaları temsil eden yeşil pikselleri bağımsız bir şekilde toplamaktaydı. Elmalar azalırken, ajanlar bir diğerini "işaretleyerek" geçici olarak devre dışı bırakabiliyor ve daha fazla elma toplamak için zaman kazanabiliyorlardı.

İkinci oyun "Wolfpack" ise bir grup AI'yi 2v1 avcı (kırmızı piksel) ve av (tekil mavi piksel) görevlerine yerleştirmekte.

Buradaki durum ise avcı, bir kurbanı her yakaladığında puan kazanıyor ancak eğer takım arkadaşı yakınındaysa daha fazla puan kazanıyor.

Gathering oyununda agresiflik (durdurma etiketi) elmalar azaldıkça kontrol edilmekteydi ve Wolfpack oyunda ise bir tekil kurt (yakınında takım arkadaşı olmayan avcı) tarafından yapılan yakalamalar ile grup bonuslu yakalamalar kontrol edilmekteydi.

Farklı boyutlarda pek çok oyun oynandıktan sonra DeepMind'ın araştırmacıları, her AI'nin kararlarını incelediler.

Google'ın Yapay Zekası, Bizim Kadar Bencil!

Bu sonuçlarda gözükene göre Gathering içerisinde AI'ler elmalar azaldıkça işaretleme kullanımı artmaktaydı ve Wolfpack'te tekil kurt yakalamaları, ortaklık puanının miktarı arttıkça azalmaktaydı.

Tahmin edilebileceği gibi bu davranış biçimleri, mantıklı insan davranışları ile doğru orantılı olarak ilerlemekte.

DeepMind'ın bu veriyi kullanma biçimine gelince de araştırmacılar, bu bulguların Homo economicus teorisini – insan doğasının genel olarak mantıklı ancak sonuç olarak bencil olduğu – desteklediğini düşünmekteler. Bu düşünce ile DeepMind, bir gün bu verilerin araştırmacıların daha karmaşık, çok öğeli sistemleri anlamalarına yardımcı olabileceğini söylemekte. Bir diğer seçenek ise bu verilerin kullanımı ile en iyi kazanmak-için-gizli-anlaşmalar-yap türü oyunların geliştirilmesi...