Wikipedia’nın arkasındaki kar amacı gütmeyen kuruluş Wikimedia, yapay zeka sistemlerinin devasa bilgi havuzuna daha kolay erişebilmesi için yeni bir veritabanı geliştirdi.
Wikidata Embedding Project nedir?
Wikimedia Deutschland (Wikimedia’nın Almanya ekibi), Wikidata Embedding Project adını verdiği yeni kaynağı duyurdu. Bu proje, Wikidata’da yer alan yaklaşık 120 milyon açık veri noktasını yapay zeka modellerinin daha rahat işleyebileceği bir formata dönüştürüyor.
Wikidata verileri her ne kadar makine tarafından okunabilir olsa da, bugüne kadar doğrudan üretken yapay zekâ sistemleriyle tam uyumlu değildi. Yeni proje, bu verileri vektörlere çeviriyor. Vektörler, kavramlar arasındaki ilişkileri sayısal koordinatlar şeklinde gösteriyor.
Kavramların haritası
Proje sayesinde, “köpek” ile “yavru köpek” gibi yakın kavramlar birbirine yakın kümelenirken, “köpek” ile “banka hesabı” gibi alakasız kavramlar daha uzak noktalarda yer alıyor. Bu yöntem, yapay zeka sistemlerinin bağlamı anlamasını ve doğal dili daha verimli işlemesini sağlıyor.
Amaç: Daha güvenilir yapay zeka
Wikimedia Deutschland, bu projeyle yapay zekâ modellerine daha kaliteli ve güvenilir bilgi sunmayı hedeflediklerini açıkladı. Çünkü günümüzde birçok yapay zekâ, şeffaf olmayan veri kümelerine dayanıyor.
Bunun yanında, proje rekabeti de teşvik ediyor. Wikidata’yı vektör formatında ücretsiz erişime açarak, yalnızca büyük teknoloji devlerinin değil, küçük yapay zekâ şirketlerinin de bu verilerden yararlanabilmesinin önü açılıyor.
Wikidata Yapay Zeka proje yöneticisi Philippe Saadé, “Bu proje, güçlü yapay zekânın sadece birkaç şirketin kontrolünde olmak zorunda olmadığını; açık ve işbirliğine dayalı bir şekilde de geliştirilebileceğini gösteriyor” dedi.
Projenin arkasında kimler var?
Proje, Eylül 2024’ten bu yana geliştiriliyor. Wikimedia Deutschland’a, veri vektörlerini oluşturan Jina AI ve bu verileri depolayan IBM’in DataStax sistemi destek sağladı.
Musk’tan rakip hamle: Grokipedia
Bu gelişmenin hemen öncesinde Elon Musk, X üzerinden yeni bir proje duyurdu: Grokipedia. Musk, “xAI’nin evreni anlaması yolunda gerekli bir adım” diyerek, Wikipedia’nın çok daha gelişmiş bir alternatifi olacağını öne sürdü.
Musk daha önce defalarca Wikipedia’yı eleştirmiş, onu “Wokipedia” olarak nitelendirmiş ve sağ görüşlü alternatiflerin olmadığını savunmuştu. Ayrıca Wikipedia’nın kurucu ortaklarından Larry Sanger’in, sitenin “küreselci, akademik, seküler ve ilerici” bir yapıya büründüğünü iddia eden paylaşımlarını da öne çıkarmıştı.
Veri kalitesi neden önemli?
Musk’ın “kendi doğrularıyla” şekillenecek yeni bir ansiklopedi girişimi, aslında Wikimedia’nın bu projeyi neden başlattığını da gösteriyor. Çünkü yapay zekâ sistemleri, beslendikleri veriler doğrultusunda yanıt veriyor. Verinin kalitesi ve tarafsızlığı, milyonlarca insanın gerçeğe dair algısını doğrudan etkileyebiliyor.