O Artık Söz Dinliyor

Hırçın PC’ler ve anlaşılmaz kullanım kılavuzlarının sonu geliyor: Teknoloji ve yenilik alanında Almanya’da verilen Gelecek Ödülü 2001’in sahibi Wolfgang Wahlster, “Bilgisayarlar insan dilini kavramayı öğrenecek ve sözümüzü dinleyecek...”<br>kehanetinde bulunuyor.

O Artık Söz Dinliyor

Dilden anlayan ve kendisi de konuşan bilgisayar, bu konuyla ilgili bilimcileri uzun süredir uğraştırıyor. Bu daldaki ilk ürün, Joseph Weizenbaum’um 1966 yılında yarattığı Chatterbot ELIZA’ydı. Bu küçük program basit bir hileye başvuruyordu: İnsan olan partnerinin yanıtından anahtar sözcükler belirliyor ve bunları bir sonraki sorusunu oluşturmada kullanıyordu. Bu durum bazı kullanıcıların bilgisayarı kendine eşdeğer bir konuşma partneri olarak tanımasına yol açıyordu. ELIZA’dan dört yıl sonra, ben o zamanlar 11. sınıftaydım, kendim bir dil yaratma programı oluşturmayı denedim: Sonuç Fortran’a entegre edilmişti ve yalnızca can sıkıcı şiirler üretiyordu. Bugün Alman Yapay Zeka Araştırma Merkezi’nin (DFKI Limited Şirketi) yöneticisiyim. Bu kuruluşun hedefleri arasında, eğitim düzeyi ve tekniğe yatkınlığından bağımsız olarak gerçekten herkesin içinde yaşadığımız bilgi toplumunun elektronik etkileşimine katılabilmesini sağlayacak şekilde bilgisayar ve internet kullanımını basitleştirmek bulunuyor.

Burada dil teknolojisi önemli bir destek oluşturuyor. Bu teknoloji olmaksızın dijital olarak depolanmış bilgiye dünyanın dört bir yanından erişmek bir hayal olarak kalmaya mahkum. Bu yüzden her insan kendiliğinden bir soru ya da bir komutu bilgisayar sistemlerine konuşarak bildirebilmeli ve tepki de yine onun için anlaşılır olmalı. Anlaşma sözlerle, jestlerle ve mimiklerle gerçekleşebilmeli. Dil işleme alanında dil tanıma, dil çözümleme ve dil anlama arasında ayrım yapılıyor. Bir radyo kanalının seçimi gibi uygulamalar için sistemin konuşmacıyı tanıması yeterli. Bu tip dil tanıyıcılar yalnızca 20 ila 100 sözcük kullanmak zorunda oldukları için, Embedded Systems olarak gitgide artan ölçüde gündelik cihazlara entegre ediliyor. Ayağa kalkmak ve kahve makinesinde bir tuşa basmak yerine, “Bir kahve, lütfen!” diye seslenmek yeterli oluyor.

Ancak çoğu soru ve dilek formülasyonu az sayıdaki anahtar sözcükten fazlasını gerektiriyor. Ama bir sonraki cep telefonu kuşağı bile dil çözümleme yoluyla anlamlar arasındaki bağıntıyı anlayabilecek ve bize internet ve konumlandırma sistemleriyle bağlantılı olarak alışveriş danışmanı ve kılavuz olarak hizmet verecek. Çevirmen bir cep telefonunun geliştirilmesine DFKI’nin Verbmobil sistemi (http://verbmobil.dfki.de) katkıda bulunuyor. Verbmobil kendiliğinden dili tanıyor, çözümlüyor ve şu sıralar İngilizceye ve Japoncaya olmak üzere yabancı bir dile çeviriyor, bir cümle kuruyor ve bunu dile getiriyor. İstendiği takdirde telefon konuşmasından sonra bir protokol oluşturuluyor. 10 yıl sonra bir insanın konuştuğu her şeyi taşınabilir bir mini cihaza dijital olarak kaydedebilecek kadar ilerlemiş olacağız...

Konuşma kayıtları günümüz kelime işlem sistemlerinde metinler için olduğu gibi içerik bakımından da aranabilir olacak. Bunu tüm televizyon kanallarının içinden geçen içerik temelli bir arama izleyecek. “Şu anda nerede Afganistan’daki gelişmeler hakkında haberler veriliyor?” sorusunu geleceğin etkileşimli bir televizyonu yanıtlayacak: “ZDF’de ve n-tv’de” - ve sesli komut üzerine ZDF’deki haberleri gösterecek ve n-tv’dekileri de kaydedecek. Tutarlı olmak bakımından tüm bu sistemler bu durumda dil üzerinden de konfigüre edilebilmek ve programlanabilir olmak zorunda. Tabii ki bu tip sistemler artık her bir kullanıcı tarafından kendi sesi için bireysel olarak uyumlandırılmak zorunda değil. Aynı şekilde yerel şiveler de bir sorun yaratmıyor, ama bu durum endüstri bakımından yerel dil verilerinin toplanmasına yapılacak yatırıma değeceği koşuluyla gündeme gelecek.

Dil diyalogu sistemlerinin geleceği, iki noktaya bağlı:
Bunlardan ilki, dil diyalogu sunucularıyla birlikte dilin gerçek zamanlı işlenmesini olanaklı kılan en küçük mobil cihazların işlemci ve bellek performanslarının ne derece yükseleceği. İkincisi ise, bizim konuşma ve anlama sırasında beynimizde cereyan eden olayları anlayıp anlayamayacağımız ve anlayabileceğimiz takdirde bunun ne zaman olabileceği. Biz kendi zekamızı anlayamadığımız sürece, bilgisayarlar kısıtlı zekaya sahip insanlar olarak kalacak.

Okuyucu Yorumları