Dünyanın en güçlü yapay zekaları poker masasında kapıştı
ChatGPT ve Gemini gibi Dünyanın en güçlü dokuz büyük dil modeli, her biri 100 bin dolarlık sermayeyle No-Limit Texas Hold 'em turnuvasında karşılaştı. Beş gün süren kıyasıya rekabetin ardından, bakın kazanan hangisi oldu…
Dijital ortamda eşi benzeri görülmemiş bir strateji savaşında, dünyanın en güçlü dokuz büyük dil modeli, beş gün boyunca yüksek riskli bir poker maçına kilitlendi. OpenAI'den o3, Google'dan Gemini 2.5 Pro, Anthropic'ten Claude Sonnet 4.5 ve Meta'dan Llama 4 gibi dev modellerin de aralarında bulunduğu AI'lar, her biri 100.000 dolarlık başlangıç sermayesiyle binlerce el No-Limit Texas Hold 'em Poker oynadı. Tamamen yapay zeka tarafından yönetilen bu deneysel turnuva, makinelerin belirsizlik altında nasıl kararlar aldığını görmemizi amaçlıyordu.
Beş günlük dijital rekabetin galibi
Beş günlük mücadelenin sonunda, OpenAI'nin o3 modeli masadan 36.691 dolar karla ayrılan taraf oldu. o3, en büyük beş potun üçünü kazanarak ve kitap teorisine sıkı sıkıya bağlı kalarak en istikrarlı performansı sergiledi. Onu sırasıyla 33.641 dolar ve 28.796 dolar kar elde eden Anthropic'in Claude'u ve X.ai’nin Grok'u takip etti. Öte yandan Meta'nın Llama modeli erkenden tüm sermayesini kaybederken, Moonshot’ın Kimi K2 modeli ise büyük kan kayıplarıyla maçı tamamladı. Google'ın Gemini'si ise mütevazı bir kar elde etti.
Pokerin yapay zeka için anlamı ne?
Poker, uzun zamandır genel amaçlı yapay zekaları test etmek için en iyi benzetim araçlarından biri olarak kabul ediliyor. Satranç veya Go gibi kusursuz bilgiye dayanan oyunların aksine, poker oyuncuların belirsizlik altında akıl yürütmesini gerektiriyor. Bu durum; iş müzakerelerinden askeri stratejiye kadar gerçek dünya karar verme süreçlerinin bir aynası haline geliyor. Turnuva, AI'ların sadece blöf yapıp bahse girmeyi değil, aynı zamanda rakiplerini modelleyerek ve belirsizlikte yol almayı gerçek zamanlı öğrendiğini gösterdi.
Yapay zekalar hala çok agresif ve kusurlu
Turnuvanın tutarlı sonuçlarından biri, botların çoğunun genellikle çok agresif olmasıydı. Çoğu model, pas geçmenin daha akıllıca olacağı durumlarda bile aksiyon ağırlıklı stratejileri tercih etti. Büyük potları kaybetmekten kaçınmaktan çok, büyük potları kazanmaya odaklandılar. Ayrıca blöf konusunda da kötüydüler; blöflerinin çoğunlukla elleri yanlış okumalarından kaynaklanması dikkat çekiyor. Bu durum, güçlü dil modellerinin bile halen hatalara sahip olduğunu, durumları yanlış okuyabildiğini ve sallantılı sonuçlar çıkarabildiğini hatırlatıyor.