Use of regression in noisy speech recognition

Bu çalışmada, gürültülü ses tanıma oranlarının iyileştirilmesinde çoklu regresyon analizinin katkısı araştırılmıştır. Gürültülü ortamda ses tanıma sürecinde, ilk önce, gürültülü sesin öznitelik vektörünü temiz sesin öznitelik vektörüne haritalayan bir ilgin (affine) dönüşümden faydalanılmaktadır. Bu dönüşümden sonra, tanıma aşaması Ortak Vektör Yaklaşımı (OVY) ile yürütülmektedir. Tanıma oranlarını iyileştirmek için, ilgin (affine) dönüşüm sırasında birçok doğrusal ve doğrusal olmayan regresyon modeli kurulmuş ve hem doğrusal hem de doğrusal olmayan terimler bu modele eklenmiştir. Deneysel çalışmalarda, 0 dB, 5 dB, 10dB ve 20 dB Sinyal/Gürültü Oranı (SGO) değerlerindeki gürültülü ses sinyalleri için tanıma oranları elde edilmiştir. 20, 10, 5 ve 0 dB SGO gürültülü sesler, Texas Instruments (TI) Rakam veritabanından alınan temiz seslerin üzerine Beyaz Gauss gürültünün MATLAB ortamında eklenmesi ile elde edilmiştir. Doğrusal olmayan terimlerin modele eklenmesi sonucu tanıma oranlarında iyileşmeler gözlemlenmiştir.

Gürültülü ses tanımada regresyon kullanımı

In this study, we investigated the contribution of the multiple regression to robust noisy speech recognition in improving the recognition rates. When the noisy speech recognition process is carried out; first of all, an Affine Transformation is performed in order to map the feature vectors of noisy speech into those of clean speech. After transforming, the recognition step is achieved using the Common Vector Approach (CVA). We used several multiple linear as well as non- linear regression models to improve the recognition rates by adding non-linear terms into the model during the affine transformation stage. In the experimental study, the recognition rates of the noisy speech signals with 0 dB, 5 dB, 10dB, and 20 dB Signal-to-Noise Ratio (SNR) values have been obtained. Noisy speech which has 20, 10, 5, and 0 dB SNR is obtained using MATLAB by adding white Gaussian noise on the clean speech taken from the Texas Instruments (TI) Digit Database. Improvements are observed when non-linear terms are introduced into the model.

___

  • Basbug, F., Swaminathan, K. & Nandkumar, S. (2003). Noise reduction and echo cancellation front-end for speech codecs. IEEE Transactions on Speech and Audio Processing, 11(1), 1- 13.
  • Chien, J.-T. (2003). Linear regression based Bayesian predictive classification for speech recognition. IEEE Transactions on Speech and Audio Processing, 11(1), 70-79.
  • David, A. F. (2005). Statistical Models: Theory and Practice. Cambridge: Cambridge University Press.
  • Gulmezoglu, M. B., Dzhafarov, V., Keskin, M. & Barkana, A. (1999). A novel approach to isolated word recognition. IEEE Transactions on Speech and Audio Processing, 7(6), 620- 628.
  • Gulmezoglu, M. B., Dzhafarov, V. & Barkana, A. (2001). The Common Vector Approach and its relation to Principal Component Analysis. IEEE Transactions on Speech and Audio Processing, 9(6), 655-662.
  • Karnjanadecha, M. & Zahorian, S. A. (2001). Signal modeling for high-performance robust isolated word recognition. IEEE Transactions on Speech and Audio Processing, 9(6), 647- 654.
  • Lee, C., Hyun, D., Choi, E., Go, J. & Lee, C. (2003). Optimizing feature extraction for speech recognition. IEEE Transactions on Speech and Audio Processing, 11(1), 80-87.
  • Mammone, J. R., Zhang, X. & Ramachandran, R. P. (1996, September). Robust speaker recognition – A feature based approach. IEEE Signal Processing Magazine, 58-71.
Dumlupınar Üniversitesi Sosyal Bilimler Dergisi-Cover
  • Yayın Aralığı: 4
  • Başlangıç: 1999
  • Yayıncı: Dumlupınar Üniversitesi Rektörlüğü
Sayıdaki Diğer Makaleler

Sosyal ağlarının üniversite öğrencilerinin istihdam beklentilerine etkisinin araştırılması

Namık Kemal ERDOĞAN, Verda ÖZGÜLER CANBEY

Banka şubelerinin performanslarını etkileyen faktörlerin kanonik korelasyon analizi ile incelenmesi

Çiğdem Arıcıgil ÇİLAN, Mustafa CAN

İmkb'de işlem gören gıda, tekstil ve çimento sektörü şirketlerinin finansal oranlar yardımıyla kümelenmesi

Selim BEKÇİOĞLU, Veli Rıza KALFA

A study on optimal portfolio selection via entropy optimization method and application with bist national-30 index data

Görkem SARIKAYA, Hüseyin TATLIDİL

Tahmine dayalı portföy optimizasyonu: Modern portföy teorisinde risk ve beklenen getiri kavramlarına alternatif bir yaklaşım

Tuba Yakıcı AYAN, Ali AKAY

Economic development of the black sea economic cooperation organization (bsec) member countries for the period of 2001-2011

Neslihan ARSLAN, Hüseyin TATLiDİL

Türkiye'de illerin temel bankacılık faaliyetleri yönünden kümeleme analizi yöntemiyle sınıflandırılması

Ergin UZGÖREN, Zeki YILMAZ

Sürdürülebilir rekabet gücünün sağlanmasında altı sigma'nın yönteminin kullanılması ve ford otomotiv sanayi a.ş.'de bir uygulama örneği

Mustafa USLU, Orhan ELMACI, Kadir TUTKAVUL

Havalimanından otellere tek tip araçlarla turist dağıtımı problemine çözüm önerisi ve alanya uygulaması

Kenan KARAGÜL, İbrahim GÜNGÖR

Küresel mali krizin Türk bankacılık sektörüne etkileri: Yerli ve yabancı bankaların iflas riskleri üzerine karşılaştırmalı bir analiz

Hakan BOZDAĞ, Yusuf DEMİR, Gamze YAĞCILAR GÖÇMEN