Adli Bilişim Açısından Ses İncelemeleri

Geçmişte fiziksel araçlar ve yollarla işlenen suçlar dijitalleşmenin artmasıyla giderek yerini elektronik araçlarla işlenen suçlara bırakmaktadır. Elektronik araçlarla işlenen bu suçlar arkasında, bilgisayarlar, taşınabilir cihazlar, ağ cihazları ve depolama aygıtları gibi elektronik deliller bırakmaktadır. Ses delillerinin incelenmesi ya da ses adli bilişimi (audio forensic), elektronik delilleri ve içlerinde bulunan verileri kullanarak suçların aydınlatılmasına katkıda bulunan Adli Bilişim disiplininin bir alt dalı olarak bilinmektedir. Ses adli bilişimi için halihazırda kullanılabilecek birçok ses analiz yazılımı mevcuttur. Sayısal ses işleme teknikleri tabanlı yöntemleri kullanan bu yazılımların, ses kayıtlarında kurgu/montaj tespiti (kayıt bütünlüğünün doğrulanması), spektrum analizi, bozuk kayıtların anlaşılabilirliğinin arttırılması (kayıt iyileştirme), konuşmacı profili (yaş, cinsiyet vs.) belirleme, ortam gürültüleriyle maskelenmiş ses analizi, adli takiplerde gerçek zamanlı ses analizi ve konuşmacının etnik yapısı ile ilgili olan dil ve aksan öğelerini belirleme gibi ses adli bilişimi işlemlerini otomatik olarak gerçekleştirebilmesi beklenmektedir. Bu makalede, konuşma üretimi ve ses bilimi, ses incelemede kullanılan temel konuşma işleme teknikleri, adli bilişim açıdan ses incelemeleri ve bu incelemelerde kullanılan yazılımların teknik ve performans kriterleri göz önünde bulundurularak karşılaştırılması yapılmıştır.

___

  • 1. Kara, O. K., 2011. Adli amaçlı ses analizinde otomatik konuşmacı tanıma yazılımı kullanılarak kardeşler arası ses benzerliklerinin ve farklılıklarının belirlenmesi, Yüksek Lisans Tezi, İstanbul Üniversitesi Adli Tıp Enstitüsü, İstanbul. 2. M.E.B., Müzik aletleri yapımı ses oluşum uygulamaları, Ankara, 2006. 3. Makkook, M. A., 2007. A Multimodal Sensor Fusion Architecture for Audio-Visual Speech Recognition, Master Thesis, University of Waterloo, Canada. 4. Campbell, J. P., 1997. Speaker Recognition: A Tutorial, Proceedings of the IEEE, 85, 1437-1462. 5. Parsons, T. W., 1987. Voice and Speech Processing, McGraw-Hill, New York. 6. Pentz, A., 1990. Speech science (Spath 4313) class notes, Oklahoma State University, Stillwater. 7. Ergenç, İ., 1995. Konuşma Dili ve Türkçenin Söyleyiş Sözlüğü, Şafak Matbaacılık, Ankara. 8. Sever, H., 2008. Adli Ses İncelemeleri ve Hukuki Boyutu, Adalet Yayınevi, Ankara. 9. Selen, N., 1979. Söyleyiş sesbilimi Akustik sesbilim ve Türkiye türkçesi, TDK yayınları, Ankara. 10. Artuner, H., 1994. Bir Türkçe Fonem Kümeleme Sistemi Tasarımı ve Gerçekleştirimi, Doktora Tezi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü, Ankara.. 11. Demircan, Ö., 1979. Türkiye Türkçesinin Ses Düzeni Türkiye Türkçesinde Sesler, TDK yayınları, Ankara. 12. Mengüşoğlu, E., 2004. Confidence Measures for Speech/Speaker Recognition and Applications on Turkish LVCSR, PhD Thesis, University of Mons, Belgium. 13. https://www.biyolojigunlugu.com/lys-kulak-konu-anlatimi-kulak-islevi-kulak-yapisi-kulak-bilesenleri/, YS, Kulak Konu Anlatımı, Kulak İşlevi, Kulak Yapısı, Kulak Bileşenleri, 15 Eylül 2017. 14. Flanagan, J. L., 1972. Speech Analysis; Synthesis and Perception, Springer, U.S.A.. 15. Xie, L. and Liu, Z. Q., 2006. A Comparative Study of Audio Features for Audio to Visual Conversion in MPEG-4 Compliant Facial Animation, Proceedings of the 5th International Conference on Machine Learning and Cybernetics, Dalian, August 13-16. 16. Dave, N., 2013. Feature Extraction Methods LPC, PLP and MFCC in Speech Recognition, Internatıonal Journal for Advance Research in Engıneerıng and Technology, 1, Issue VI. 17. Kavitha. R., Nachammai. N., Ranjani. R. and Shifali. J., 2014. Speech Based Voice Recognition System for Natural Language Processing (Voice Recognition using Dynamic Time Warping and Mel-Frequency Cepstral Coefficients Algorithms), International Journal of Computer Science and Information Technologies, 5, 5301-5305. 18. Gaudard, C., Aradilla, G. and Bourlard, H., 2007. Speech Recognition based on Template Matching and Phone Posterior Probabilities, IDIAP, Switzerland. 19. Karasartova, S., 2011. Metinden Bağımsız Konuşmacı Tanıma Sistemlerinin İncelenmesi ve Gerçekleştirilmesi, Yüksek Lisans Tezi, Ankara Üniversitesi Fen Bilimleri Enstitüsü, Ankara. 20. Gelegin, İ. ve Bolat, B., 2011. Ayrık Kelime Tabanlı Bir Konuşma Tanıma Sistemiyle Bilgisayar Kontrolü, Elektrik-Elektronik ve Bilgisayar Sempozyumu, Elazığ, 5-7 Ekim. 21. Yalçın, N., 2008. Konuşma Tanıma Teorisi ve Teknikleri, Kastamonu Eğitim Dergisi, 16, 249-266. 22. Rumelhart, D.E. and McClelland, J.L., 1986. Parallel Distributed Processing, MIT Press, Cambridge, 10-16. 23. Akçayol, M.A., 2001. Bir Anahtarlamalı Relüktans Motorun Sinirsel-Bulanık Denetimi, Doktora Tezi, Gazi Üniversitesi Fen Bilimleri Enstitüsü, Ankara. 24. Loizou, P.C., 2013. Speech Enhancment Theory and Practice, CRC Press, U.S.A. 25. Vaseghi, S.V., 2008. Advanced Digital Signal Processing and Noise Reduction, Wiley Publication, U.K. 26. Kutlu, C. ve Arserim, M. A., 2012. Spektral çıkarma tabanlı kalman filtresi ile ses sinyallerinin iyileştirilmesi, Dicle Üniversitesi Mühendislik Fakültesi, 3/1, 49-59. 27. Lemmetty, Sami., 1999. Review of Speech Synthesis Technology, Master Thesis, Helsinki University of Technology, Finland. 28. http://www.cs.tut.fi/courses/SGN-4010/puhesynteesi_en.pdf, Speech Synthesis. 7 Haziran 2017. 29. Macon, M. W., 1996. Speech Synthesis Based on Sinusoidal Modeling, PhD Thesis, Georgia Institute of Technology, U.S.A. 30. Tamura, M., Masuko, T., Tokuda, K. and Kobayashi T., 1999. Speaker Adaptation for HMM-Based Speech Synthesis System Using MLLR, The 3rd ESCA/COCOSDA Workshop on Speech Synthesis, Australia, November 26-29. 31. Kayte, S., Mundada, M. and Kayte C., 2015. A Review of Unit Selection Speech Synthesis, International Journal of Advanced Research in Computer Science and Software Engineering, 5, 5. 32. Gros, J. Z. and Mario, Z., 2008. An Efficient Unit-selection Method for Concatenative Text-to-speech Synthesis Systems, Journal of Computing and Information Technology, 16, 69-78. 33. http://www.ni.com/tutorial/7107/en/, IS-95 (CDMA) and GSM(TDMA) Overview, 4 Temmuz 2017. 34. http://www.forensiclinguistics.net/POST-PN-0509.pdf, Houses of Parliament, Forensic Language Analysis, 5 Temmuz 2017.