Ses işaretleri için parametrik olmayan çok boyutlu bir modelleme yaklaşımı

Bu çalışmada, ses işaretleri için parametrik olmayan bir modelleme tekniği geliştirilmiştir. Geliştirilen teknik, bir kesirli/ondalıklı boyut hesaplama yöntemine dayanmaktadır. Ses işaretleri uygun uzunluktaki parçalara/pencerelere bölünerek, her parça için bir kesirli boyut değeri hesaplanmış; müteakiben uygun sıçramalar yapmak suretiyle işaretin tamamına ait çok boyutlu bir model elde edilmiştir. Önerilen yöntemin başarımını ölçmek maksadıyla tasarlanan ve en yakın komşu algoritmasını esas alan sınıflandırma probleminde, kaydedilen ses işaretlerinin orijinalleri ve bu işaretlerin gürültü ekleme, süzme ve sıkıştırma gibi çeşitli işlemlere/saldırılara uğramış halleri kullanılmıştır. Modelleme tekniği, bu işaretlerin bir bölümünden oluşan bir eğitim kümesi yardımıyla optimize edilmiş; geriye kalan işaretlerden oluşan test kümesi yardımıyla sınıflandırmanın başarımı ölçülmüştür. Deneysel sonuçlar, geliştirilen tekniğin, konuşma tanıma, konuşmacı tanıma, konuşmacı ayrıştırma, içerik belirleme, çoklu ortam indeksleme ve dil tanıma gibi çeşitli ses işleme/tanıma uygulamalarında kullanılabileceğini göstermektedir.

A Nonparametric multidimensional modeling approach for speech signals

In this study, a nonparametric technique is developed to model speech signals. The technique is based on a non-integer dimension calculation method. Speech signals were divided into segments/windows having appropriate lengths. Then, a non-integer dimension value was calculated for each segment. The multidimensional model for the entire signal was obtained using appropriately shifted successive windows. To evaluate the performance of the proposed technique, recorded speech signals and their altered versions (e.g. noise addition, filtering and compression) were used within the framework of a classification problem based on the nearest-neighbor algorithm. The modeling technique was optimized using a learning set formed by a subset of all signals; the remaining signals were used as a test set to measure the performance of the classification. Experimental results show that the developed modeling technique can be used in various speech processing applications such as speech recognition, speaker recognition, speaker diarization, content identification, multimedia indexing and language recognition.

___

  • Annadhason, A. (2012). Methods of Fractal Dimension Computation. International Journal of Computer Science and Information Technology & Security (IJCSITS). 2(1),166-169
  • Benetsy, J., Sondhi, M.M. ve Huang, Y. (2008). Springer Handbook of Speech Processing. Berlin: Springer Press.
  • Castanié, F. (2010). Spectral Analysis: Parametric and Non-Parametric Digital Methods. Wiley-ISTE: John Wiley &Sons Press.
  • Fan, J. ve Yao, Q. (2005). Nonlinear Time Series: Nonparametric and Parametric Methods. Berlin: Springer Press.
  • Grieder, W., ve Kinsner, W. (1994). Speech Segmentation by Variance Fractal Dimension. Proc. Of IEEE Canadian Conference on Electrical & Computer Engineering, 25-28 Sept.,Canada, 2; 481-485.
  • Kraft, R. (1995). Fractals and Dimension. Technical Report. Munich, Germany: Munich University of Technology
  • Mischaikow, K. ve Mrozek, M. (1995). Chaos in the Lorenz Equations: A Computer-Assisted Proof. Bulletin of the American Matematical Society, 32(1), 66-72.
  • Pawelzik, K. ve Schuster, H.G. (1987). Generalized Dimensions and Entropies From a Measured Time Series. Physical Review A, 35(1); 481-484.
  • Peitgen, H.O., Jurgens, H. ve Saupe, D. (1992). Chaos and Fractals: New Frontiers of Science. Berlin: Springer Verlag Press.
  • Siedlecki, W. , Siedlecka, K. ve Sklansky, J. (1988). An overview of mapping techniques for exploratory analysis. Pattern Recognition, 21(5), 411-429.
  • Tekbaş, Ö. H. (2004). Karmaşık İşaret Analizi ve Çoklu-Değişinti Kırılca Boyutu Modellemesi Yoluyla Telsizlerin Kimlik Tespitinin Yapılması. (Yayımlanmamış doktora tezi), Ankara Üniversitesi, Ankara
  • Yıldırım, Ü. (2009). Fraktal Modelleme ile Ses Parmak İzlerinin Tespiti. (Yayımlanmamış yüksek lisans tezi), Kara Harp Okulu, Ankara
  • Yılmaz, D. ve Güler, N.F. (2006). Kaotik Zaman Serisinin Analizi Üzerine Bir Araştırma. Gazi Üniv. Müh. Mim. Fak. Dergisi, 21(4), 759-779