Bir Soru Cevaplama Sistemi: BayBilmiş

Bilgiye erişimin en yaygın ve en kolay yollarından biri Internet, Internet’teki bilgiye erişimin en kolay yolu ise arama motorlarıdır. Ancak arama motorlarından istenilen bilgiye erişmek için önce uygun anahtar kelimeler seçmeli, daha sonra sonuç sayfaları yada sonuç sayfalarındaki bağlantılardaki sayfalar kullanıcı tarafından bizzat. incelenmelidir. Oysa kullanıcıların belirli tipteki soruları için tüm bu işlemleri otomatik hale dönüştürmek mümkündür ve İngilizce için birçok sistem geliştirilmiştir. Kullanıcısından sorusunu doğal dillerde kabul edebilen ve kullanıcısına cevabı bulması için sayfa adresleri listesi yerine cevabın kendisini verebilen sistemlere soru cevaplama sistemleri denmektedir. Bu çalışmada; Türkçe için doğal dille çalışan bir soru cevaplama sistemi gerçekleştirilmiştir. Sistem öncelikle kullanıcısının doğal dille sorduğu sorusunu arama motoru sorgusuna çevirmekte ve arama motorunun sonuç sayfasından yada bağlantılarındaki sayfalardan olası cevap cümlelerini seçmektedir. Olası cevap cümlelerini çeşitli kriterlere göre puanlandırıp en yüksek puanı alan ilk beş cümle kullanıcıya iletilmektedir. Sistem 524 adet soruyla değerlendirilmiş ve arama motorunun sonuç sayfası kullanıldığında soruların yaklaşık %43’ üne, sonuç sayfasının bağlantılarındaki sayfalar kullanıldığında %60’ına ilk beş cümle içinde doğru cevap verebilmiştir.

The easiest and common way to achieve information is Internet. The easiest way to achieve information on Internet is using a search engine. But user most do extra processes (selection of keywords, research on result pages and web sites) while using a search engine. These extra processes can be done automatically for some kind of queries. The systems, that accepts user queries in natural language and results in only answer not a document list, are named Question-Answering Systems. The instances of these systems exist for English. In this study, a Question-Answering system is built for Turkish. The system converts user question in natural language to search engine query and sends these queries to a search engine and receives result page. In result page and the web pages which web addresses are in result page, the answer candidate sentences are selected. The candidate answers are ranked according to four criteria. The five candidates which have the highest scores are the answers. The system is examined with 524 questions. 43% of questions are answers correctly in first five sentences when the result page of search engine was used. 60% of questions are answers correctly in first five sentences when the real pages (at the result page’s links) was used.