Ses işaretlerine karşı basilar membran hareketinin yazılım benzetimi

İnsanın işitsel sistemi, duyabileceğimiz tüm karmaşık akustik işaretleri duyumsayacak, ayırabilecek ve tanımlayacak bir olağanüstü mekanizma örneği sergilemektedir. İnsan kulağının yaptığı analizin ses tanıma için en güçlü ön-işleme olduğuna inanan birçok bilim adamının varlığı, son zamanlarda ,insanın ses üretme ve işitme mekanizmalarının önemle incelenmesine yol açmıştır. Ses işaretlerinin işlenmesinde işitsel sistemin matematiksel modelinin kullanılmasının sağlayacağı yarar, oluşturulacak bir işitsel modelin gerçek durumu ne ölçüde yansıtacağı, bu kısmın gerçeğine ne derecede yakın temsil edildiğine son derece bağlı olacaktır. Bu makalede, basilar membranın bir gamaton süzgeç takımı ile modellenmesi ve onun ses işaretine cevabının benzetimi tanıtılmıştır. Ayrıca örnek bir ses işaretleri kullanılarak, basilar membranın hareketi 3-boyutlu olarak resmedilmiştir.

Software simulation of basilar membrane motion in response to speech signals

The human auditory system represents an amazing technical mechanism which can detect, separate, and recognise a very wide variety of complex waveforms carried as waves in air. Since many researchers believe that the analysis performed by the human ear is the most robust "front-end" for speech recognition, the human vocal and hearing apparatus has recently received extensive study. In any task of speech processing, to have benefits from using computational models of the auditory system depends on how precisely the models can mimic human performance. In this paper, we introduce modelling the basilar membrane by a gammatone filterbank and simulate its motion in response to acoustic signals. A speech sound example is also given, for which the motion of the basilar membrane is visualised in 3-D.

___

  • Campbell, J. P., (1997) Speaker recognition: A tutorial, Proc. IEEE, Vol. 85, no.9,pp 1437-1463
  • de Boer, E. and Kuyper, P., (1968) Triggered correlation, IEEE Trans, on Biomedical Engineering, 15 (3), pp 169- 179
  • Glasberg, B. R. and Moore, B. C. J., (1990) Derivation of auditory filter shapes from notched-noise data, Hearing Research, 47, pp 103-138.
  • Holdsworth, J., Nimmo-Smith, I., Patterson, R. D. and Rice, P., (1988) Implementing a gammatone filterbank, in Auditory / Connectionist Tecliniques for Speech, Applied Psychology Unit, Cambridge University.
  • Meddis, R. and Hewitt, M. J., (1991) Virtual pitch and phase sensitivity of a computer model of the auditory periphery : Pitch identification J AS A, 89(6), pp 2866-2882.
  • O'Shaughnessy, D., (1990) Speaker Recognition, in Speech Communication: Human and Machine. Chapter 11, Addison-Wesley Publishing.
  • Patterson, R. D„ (1976) Auditory filter shapes derived with noise stimuli, JASA, 59, pp 640-654.
  • Patterson R.D. and Moore B.C.J., (1986) Auditory filters and excitation patterns as representations of frequency resolution, in Frequency Selectivity in Hearing, Ed. B.C.J. Moore, Academic, London, pp 123-177.
  • Patterson, R. D., Nimmo-Smith, I., HoIdsworth, J. and Rice. P., (1987) An efficient auditory filterbank based on the gammatone function, Institute of Acoustics Speech Group Meeting on Auditory Modelling, RSRE, December 14-15.
  • Schofıeld, D., (1985) Visualisations of speech based on a model of the peripheral auditory system, UK National Physical Lab. Report, 62/85, HMSO.
Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi-Cover
  • ISSN: 1300-7688
  • Yayın Aralığı: Yılda 3 Sayı
  • Başlangıç: 1995
  • Yayıncı: Süleyman Demirel Üniversitesi