Anthropic, yapay zekâların kendi aralarında alışveriş yaptığı bir test ortamı kurdu. Şirket, bu deneyde hem alıcıyı hem satıcıyı temsil eden ajanlar kullandı ve gerçek ürünler için gerçek para üzerinden anlaşmalar yapıldı.
Yapay zekâlar pazara çıktı
Anthropic bu çalışmaya “Project Deal” adını verdi. Şirket, deneyin küçük bir pilot olduğunu açıkça söyledi. Teste 69 çalışan katıldı. Her katılımcıya 100 dolarlık hediye kartı verildi ve çalışanlar bu bütçeyle birbirlerinden ürün satın aldı.
Kısa sürede yüzlerce anlaşma
Deney beklenenden hızlı ilerledi. Toplamda 186 anlaşma yapıldı. Bu işlemlerin değeri 4.000 doları geçti. Şirket, sistemin pratikte sorunsuz çalıştığını ve bu sonuçların dikkat çekici olduğunu belirtti.
Farklı modellerle dört ayrı pazar
Anthropic, tek bir pazarla yetinmedi. Dört farklı pazar kurdu. Bunlardan biri “gerçek” senaryoydu. Bu modelde en gelişmiş yapay zekâ kullanıldı ve deney sonrası anlaşmalar gerçekten uygulandı. Diğer üç pazar ise karşılaştırma için oluşturuldu.
Daha güçlü model daha iyi sonuç getirdi
Sonuçlar net bir fark gösterdi. Daha gelişmiş yapay zekâ ile temsil edilen kullanıcılar daha iyi anlaşmalar yaptı. Ancak ilginç bir durum ortaya çıktı: Kullanıcılar bu farkı pek fark etmedi.
Bu durum, sistemde “ajan kalitesi farkı” oluşabileceğini gösterdi. Yani bazı kullanıcılar dezavantajlı durumda olsa bile bunu anlamayabilir.
Talimatlar sonucu pek değiştirmedi
Deneyde verilen başlangıç talimatları satış ihtimalini veya fiyatları ciddi şekilde etkilemedi. Yani pazarlığın sonucu, talimatlardan çok kullanılan modelin gücüne bağlı kaldı.