KONUŞMACI YAŞ VE CİNSİYETİNİN GKM SÜPERVEKTÖRLERİNE DAYALI BİR DVM SINIFLANDIRICISI İLE BELİRLENMESİ

Bu çalışmada, özellikle konuşmacı doğrulama sistemlerinde yaygın olarak kullanılan GKM süpervektörlerine dayalı DVM yaklaşımı, konuşmacıların yaş ve/veya cinsiyetlerine göre sınıflandırılması problemine uyarlanmıştır. Çalışmada ayrıca farklı sayıda GKM bileşeniyle oluşturulan yaş ve cinsiyet modelleri, farklı uzunlukta konuşmalarla test edilerek konuşma süresinin ve GKM bileşen sayısının başarıya etkisi de araştırılmıştır. Bu amaçla konuşmaların ses içermeyen bölümleri enerjiye dayalı olarak atıldıktan sonra kalan sesli bölümlerden çıkarılan Mel-Frekanslı Kepstrum Katsayıları (MFCC) kullanılarak üç kategoride testler yapılmıştır. Bu testlerde en yüksek sınıflandırma başarıları 16 sn’lik konuşmaların 64 bileşenli GKM’lerle modellenmesi sonucunda elde edilmiştir. Bu oranlar cinsiyet kategorisinde (çocuk, bayan, erkek) %92.42, yaş kategorisinde (çocuk, genç, yetişkin, yaşlı) %60.1 ve yaş-cinsiyet kategorisinde ise %60.02 olarak ölçülmüştür. 

___

  • Neti, C., and S. Roukos. "Phone-context specific gender-dependent acoustic-models for continuous speech recognition." Automatic Speech Recognition and Understanding, 1997. Proceedings., 1997 IEEE Workshop on. IEEE, 1997.
  • Schuller, B., Steidl, S., Batliner, A., Burkhardt, F., Devillers, L., Müller, C. A., & Narayanan, S. S. (2010, September). The INTERSPEECH 2010 paralinguistic challenge. In INTERSPEECH (pp. 2794-2797).
  • Mysak, Edward D. "Pitch and duration characteristics of older males." Journal of Speech & Hearing Research (1959).
  • Metze, Florian, et al. "Comparison of four approaches to age and gender recognition for telephone applications." Acoustics, Speech and Signal Processing, 2007. ICASSP 2007. IEEE International Conference on. Vol. 4. IEEE, 2007.
  • Li, Ming, Kyu J. Han, and Shrikanth Narayanan. "Automatic speaker age and gender recognition using acoustic and prosodic level information fusion."Computer Speech & Language 27.1 (2013): 151-167.
  • van Heerden, Charl, et al. "Combining regression and classification methods for improving automatic speaker age recognition." Acoustics Speech and Signal Processing (ICASSP), 2010 IEEE International Conference on. IEEE, 2010.
  • Meinedo, Hugo, and Isabel Trancoso. "Age and gender classification using fusion of acoustic and prosodic features." INTERSPEECH. 2010.
  • Bocklet, T., Stemmer, G., Zeissler, V., & Nöth, E. (2010). Age and gender recognition based on multiple systems-early vs. late fusion. In INTERSPEECH(pp. 2830-2833).
  • J. R. Deller, J. H. L. Hansen, J. G. Proakis, Discrete-Time Processing of Speech Signals, IEEE Press, Piscataway (N.J.), 2000.
  • Davis, Steven, and Paul Mermelstein. "Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences." Acoustics, Speech and Signal Processing, IEEE Transactions on28.4 (1980): 357-366.
  • S. Furui, Digital Speech Processing, Synthesis and Recognition, New York,
  • Marcel Dekker, 2001.
  • Reynolds, Douglas A., and Richard C. Rose. "Robust text-independent speaker identification using Gaussian mixture speaker models." Speech and Audio Processing, IEEE Transactions on 3.1 (1995): 72-83.
  • McLachlan, Geoffrey, and David Peel. Finite mixture models. John Wiley & Sons, 2004.
  • Dempster, Arthur P., Nan M. Laird, and Donald B. Rubin. "Maximum likelihood from incomplete data via the EM algorithm." Journal of the Royal Statistical Society. Series B (Methodological) (1977): 1-38.
  • Reynolds, Douglas A., Thomas F. Quatieri, and Robert B. Dunn. "Speaker verification using adapted Gaussian mixture models." Digital signal processing10.1 (2000): 19-41.
  • Ferras, Marc, et al. "Comparison of speaker adaptation methods as feature extraction for SVM-based speaker recognition." Audio, Speech, and Language Processing, IEEE Transactions on 18.6 (2010): 1366-1378.
  • Campbell, W. M., Sturim, D. E., and Reynolds, D. A.,"Support Vector Machines using GMM Supervectors for Speaker Verification", IEEE Signal Processing Letters, 13(5):308–311, May 2006.
Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi-Cover
  • ISSN: 1300-1884
  • Yayın Aralığı: Yılda 4 Sayı
  • Başlangıç: 1986
  • Yayıncı: Oğuzhan YILMAZ
Sayıdaki Diğer Makaleler

Web tabanlı saldırı önleme sistemi tasarımı ve gerçekleştirilmesi: yeni bir hibrit model

Ömer Faruk BAY, Adem TEKEREK, Cemal GEMCİ

Su Bazlı Boya Atık Suyu Arıtımında Bir Adım İleri Gelişmiş Deneysel pH Kontrol Uygulaması

Şule Camcıoğlu, Baran Özyurt, Zehra Zeybek, Hale Hapoğlu

Rüzgar türbinlerinde mekanik dengesizlik arızalarının elektriksel ölçümlerden tespit edilmesi

Mehmet BAYRAK, Ahmet KÜÇÜKER, Eric NDUWAYEZU

4-kutuplu karma elektromıknatısın 3 serbestlik derecesinde manyetik yastıklama kontrolü

Hüseyin ÜVET, Kadir ERKAN, Hasan Fatih ERTUĞRUL

KONUŞMACI YAŞ VE CİNSİYETİNİN GKM SÜPERVEKTÖRLERİNE DAYALI BİR DVM SINIFLANDIRICISI İLE BELİRLENMESİ

Ergün Yücesoy, Vasif V. Nabiyev

İnce daneli zeminlerde sıkışma indisi'nin istatistiksel ve yapay zeka yöntemleri ile tahmin edilmesi

Şaban YURTCU, Aşkın ÖZOCAK

MODÜLER YENİDEN YAPILANDIRILABİLİR ROBOT MODÜLÜ OMNIMO’NUN TASARIMI VE ÜRETİMİ

Ali KILIÇ, Sadettin KAPUCU

TOZ KATKILI VE ISITILMIŞ DİELEKTRİĞİN ELEKTRO EROZYON İLE İŞLEMEDE (EEİ) DELİK DELME PERFORMANSI ÜZERİNE ETKİSİ

Oğuz Erdem, Can Çoğun, Levent Urtekin, Hacı Bekir Özerkan, İbrahim Uslan

pH titrasyon eğrilerine durum-uzayı yaklaşımı

İbrahim ALIŞKAN, Mesut UYSAL

Önden Yüklemeli Bir Çamaşır Makinesinin Sonlu Elemanlar Yöntemiyle Dinamik Olarak Modellenmesi

Mehmet ÖZER, Atakan ALTINKAYNAK, Vedat TEMİZ, Turhan MUTLU, Tuğba DIŞPINAR, Abdulkadir ÖZGEN, Murat YÜCEL