Stajyerin yazdığı kod dünya şampiyonunu devirdi

Mart 2016’da Google DeepMind tarafından geliştirilen AlphaGo adlı yapay zekâ sistemi, dünyanın en güçlü Go oyuncularından Lee Sedol’ü beş maçlık seride yenerek teknoloji tarihinde unutulmaz bir ana imza attı. Milyonlarca kişinin canlı izlediği karşılaşma, yapay zekânın ulaştığı seviyeyi tüm dünyaya gösteren tarihi bir dönüm noktası olarak kabul edildi.

Bugün Toronto Üniversitesi’nde yapay zekâ profesörü olan Chris Maddison, o dönemde yalnızca yüksek lisans öğrencisiydi. Projenin ilk aşamalarında görev alan Maddison, AlphaGo’nun temellerinin aslında oldukça basit bir fikirle ortaya çıktığını anlatıyor.

Her şey, daha sonra OpenAI’ın kurucuları arasında yer alacak olan Ilya Sutskever’in önerisiyle başladı. Sutskever, uzman bir Go oyuncusunun tahtaya baktığında yarım saniye içinde en iyi hamleyi seçebildiğini ve bu sürecin insan beyninde tek bir görsel işlem döngüsüne denk geldiğini savundu. Bu da aynı sürecin bir sinir ağıyla öğrenilebileceği anlamına geliyordu. Bu fikir Maddison’ı ikna etti ve 2014 yazında Google Brain’e stajyer olarak katıldı.

Başarısız denemelerden doğan kritik fikir

Maddison ekibe katıldığında DeepMind’da Aja Huang ve David Silver liderliğinde küçük bir ekip zaten Go üzerinde çalışıyordu. Maddison’ın görevi, sistemin temelini oluşturacak sinir ağlarını geliştirmekti. İlk denemelerin büyük kısmı başarısız oldu. Farklı yöntemler test edildi ancak istenen sonuçlar alınamadı. Sonunda Maddison, oldukça basit bir yaklaşımı denemeye karar verdi.

Uzman Go oyuncularının oynadığı çok sayıda oyundan oluşan büyük bir veri seti kullanarak, belirli bir tahta durumunda bir ustanın hangi hamleyi yapacağını tahmin etmeye çalışan bir sinir ağı eğitti. Bu yöntem beklenmedik şekilde işe yaradı ve projenin ilerlemesini sağlayan temel yaklaşım haline geldi. 2014 yazının sonunda DeepMind araştırmacısı Thore Graepel ile küçük bir test maçı düzenlendi. Maddison’ın geliştirdiği ağlar bu maçı kazandı. Bu sonuç, DeepMind yönetimini projenin gerçek bir başarıya dönüşebileceğine ikna etti ve AlphaGo için daha büyük bir ekip kurulmaya başlandı.

Ekibin nihai hedefi dünyanın en güçlü Go oyuncularından biri olan Lee Sedol’ü yenmekti. Maddison, o dönemde Sedol’ün fotoğrafının çalışma masalarının yanında durduğunu hatırlıyor. Go oyuncusu olmayan Maddison, geliştirdiği her yeni ağın performansını Aja Huang’a soruyordu. Huang ise Sedol’ün seviyesini anlatmak için şu ifadeyi kullanıyordu: “Lee Sedol Tanrı’dan yalnızca bir taş uzakta.” Bu söz, hedefin ne kadar zor olduğunu anlatıyordu.

Tarihi maçtan önce ayrılan isim

Maddison, AlphaGo’nun Lee Sedol ile karşılaşmasından önce projeden ayrıldı. David Silver’ın projede kalması yönündeki teklifini reddederek doktora çalışmalarına odaklanmayı tercih etti. Daha sonra projeye dışarıdan danışmanlık yapmaya devam etti. Ona göre Lee Sedol’ü yenen nihai sistem, büyük bir mühendislik çalışmasının ve geniş bir ekibin ürünüydü.

2016’da Seul’de oynanan karşılaşmalar sırasında yaşanan atmosfer Maddison’a göre tarif edilmesi zor bir deneyimdi. Maçların oynandığı otelden şehirdeki büyük bir kavşağı görebiliyordu. Dev bir ekranda AlphaGo ile Lee Sedol arasındaki maç yayınlanıyordu ve sokaklarda yüzlerce insan durup oyunu izliyordu. İlk oyunun Çin’de yüz milyonlarca kişi tarafından izlendiği söyleniyordu. Maddison o anı, Doğu Asya’nın adeta durup bu karşılaşmayı izlediği bir an olarak hatırlıyor.

AlphaGo ile büyük dil modelleri arasındaki bağ

Bugün yapay zekâ dünyasında büyük dil modelleri ön planda olsa da Maddison’a göre AlphaGo ile modern sistemler arasında güçlü bir teknolojik bağ bulunuyor. AlphaGo’nun ilk aşamasında sinir ağı, bir insan oyuncunun bir sonraki hamlesini tahmin etmeyi öğreniyordu. Günümüzde büyük dil modelleri de benzer şekilde internetten toplanan metinlerle bir sonraki kelimeyi tahmin etmeyi öğrenerek ön eğitimden geçiyor. İkinci aşamada ise AlphaGo pekiştirmeli öğrenme kullanarak kazanma hedefi doğrultusunda eğitildi. Aynı yöntem günümüzde dil modellerinin davranışlarını belirli hedeflere uyumlu hale getirmek için de kullanılıyor.

Maddison’a göre yapay zekâ ilerledikçe insanın rolünün ortadan kalkacağı düşüncesi doğru değil. Satranç örneğinde olduğu gibi, güçlü yapay zekâların varlığı bir oyunu ortadan kaldırmak yerine çoğu zaman onu daha da zenginleştiriyor. Yapay zekâlar oyunun yeni stratejilerini ortaya çıkarabiliyor ve insanlara oyunun güzelliğini farklı bir açıdan gösteriyor. Go’nun amacı yalnızca kazanmak değil; aynı zamanda keşfetmek, öğrenmek ve eğlenmek. Maddison’a göre yapay zekâ da bu sürecin bir parçası haline geliyor.