FEATURE SELECTION AND CLASSIFICATION TECHNIQUES FOR SPEAKER RECOGNITION

Konuşmacı tanıma; özellik seçip elde etme, sınıflandırma ve örüntü karşılaştırma olarak üç aşamadan oluşan örüntü tanıma olarak bilinen genel bir alanın, bir alt kümesi olarak düşünülebilir. Geçmişten bu yana, konuşmacı tanımaya elverişli ses karakteristiklerinin bulunması yönünde yoğun çalışmalar yapılmış olmasına rağmen, henüz tüm şartlar için mükemmel ayırt etmeye yarayan bir özellik kümesi bulunamamıştır. Dolayısı ile, özelliklerin sistem başarımına etkisi uygulamanın tipine bağlı olduğundan, has özelliklerin seçimi tanıma işleminin en önemli basamağını oluşturmaktadır. Bu makalede, ses özellikleri ve daha çok metinden bağımsız konuşmacı tanıma için geliştirilmiş en çok bilinen sınıflandırma tekniklerine genel bir bakış verilmiştir. Ayrıca, uygun ses özellikleri ve sınıflayıcıların seçimleri karşılaştırmalı olarak tartışılmıştır.

KONUŞMACI TANIMA İÇİN ÖZELLİK SEÇİMİ VE SINIFLANDIRMA TEKNİKLERİ

Speaker recognition can be considered as a subset of the more general area known as pattern recognition, which may be viewed basically in three stages as: feature selection and extraction, classification, and pattern matching. Extensive research in the past has been directed towards finding effective speech characteristics for speaker recognition. But, so far, no feature set is found to be known to allow perfect discrimination for all conditions. As the performance of features depends on the nature of application, the selection of salient features is a key step in the recognition process. In this paper, we present a general view of speech features and well known classifiers originally developed for text-independent speaker recognition systems. A comparative discussion on choice of suitable speech features and classification techniques is also given.