Dünyanın en güçlü yapay zekaları poker masasında kapıştı

Beş günlük dijital rekabetin galibi

Beş günlük mücadelenin sonunda, OpenAI'nin o3 modeli masadan 36.691 dolar karla ayrılan taraf oldu. o3, en büyük beş potun üçünü kazanarak ve kitap teorisine sıkı sıkıya bağlı kalarak en istikrarlı performansı sergiledi. Onu sırasıyla 33.641 dolar ve 28.796 dolar kar elde eden Anthropic'in Claude'u ve X.ai’nin Grok'u takip etti. Öte yandan Meta'nın Llama modeli erkenden tüm sermayesini kaybederken, Moonshot’ın Kimi K2 modeli ise büyük kan kayıplarıyla maçı tamamladı. Google'ın Gemini'si ise mütevazı bir kar elde etti.

Pokerin yapay zeka için anlamı ne?

Poker, uzun zamandır genel amaçlı yapay zekaları test etmek için en iyi benzetim araçlarından biri olarak kabul ediliyor. Satranç veya Go gibi kusursuz bilgiye dayanan oyunların aksine, poker oyuncuların belirsizlik altında akıl yürütmesini gerektiriyor. Bu durum; iş müzakerelerinden askeri stratejiye kadar gerçek dünya karar verme süreçlerinin bir aynası haline geliyor. Turnuva, AI'ların sadece blöf yapıp bahse girmeyi değil, aynı zamanda rakiplerini modelleyerek ve belirsizlikte yol almayı gerçek zamanlı öğrendiğini gösterdi.

Yapay zekalar hala çok agresif ve kusurlu

Turnuvanın tutarlı sonuçlarından biri, botların çoğunun genellikle çok agresif olmasıydı. Çoğu model, pas geçmenin daha akıllıca olacağı durumlarda bile aksiyon ağırlıklı stratejileri tercih etti. Büyük potları kaybetmekten kaçınmaktan çok, büyük potları kazanmaya odaklandılar. Ayrıca blöf konusunda da kötüydüler; blöflerinin çoğunlukla elleri yanlış okumalarından kaynaklanması dikkat çekiyor. Bu durum, güçlü dil modellerinin bile halen hatalara sahip olduğunu, durumları yanlış okuyabildiğini ve sallantılı sonuçlar çıkarabildiğini hatırlatıyor.