Bebek Ağlamalarının Makine Öğrenmesi Yöntemleriyle Sınıflandırılması

Bu çalışmada bebek ağlama seslerinden yararlanılarak, bebeklerin ihtiyaçlarını belirleyebilmek ve herhangi bir hastalığa maruz olup olmadıklarını öğrenmek için çeşitli makine öğrenmesi yöntemleri kullanılmıştır. Bebek ağlama sesleri için iki farklı veri kümesinden yararlanılmıştır. Veri kümeleri eğitim, öğrenme ve test aşamalarından geçtikten sonra ağlama türünün bulunması hedeflenmiştir. Ağlama seslerinin özniteliklerini çıkarmak için Mel Frekans Kepstrum Katsayıları (MFCC) ve Doğrusal Öngörü Kepstrum Katsayıları (LPCC) yöntemleri karşılaştırılmış ve MFCC yönteminin doğruluğu arttırmada LPCC’ye göre daha etkili olduğu bulunmuştur. Öznitelikleri çıkarılan ses sinyallerinin sınıflandırılma aşamasında makine öğrenme algoritmalarından k-En Yakın Komşuluk (k-NN) algoritması, Çok Katmanlı Algılayıcılar, Karar Ağacı ve Rastgele Orman algoritmaları kullanılmış ve başarı oranları karşılaştırılmıştır. Sonuçta MFCC ve Çok Katmanlı Algılayıcılar yöntemi kullanılarak %93 başarı oranı bulunmuştur.

Classification of Infant Cries with Machine Learning Methods

In this study, various machine learning methods were used to determine the needs of babies and to find out whether they were exposed to any disease by making use of baby crying sounds. Two different data sets were used for baby crying sounds. It is aimed to find the type of crying after the data sets go through the training, learning and testing stages. Mel Frequency Cepstral Coefficients (MFCC) and Linear Prediction Cepstral Coefficients (LPCC) methods were compared to extract the attributes of crying sounds, and the MFCC method was found to be more effective than LPCC in increasing accuracy. In the classification phase of the audio signals whose attributes were extracted, k-Nearest Neighborhood (k-NN) algorithm, Multilayer Perceptron, Decision Tree and Random Forest algorithms from machine learning algorithms were used and success rates were compared. As a result, a 93% success rate was found using MFCC and Multilayer Perceptron.

___

  • Ahmed, M. C. and Koçer, H. E. (2019). Turkish Speech recognition using Mel-frequency cepstral coefficients(MFCC) and Hidden Markov Model (HMM). Veri Bilimi Dergisi, 2(2), 39-44.
  • Bănică, I.-A., Cucu, H., Buzo, A., Burileanu, D. and Burileanu, C. (2016). Baby cry recognition in real-world conditions. 2016 39th International Conference on Telecommunications and Signal Processing (TSP), 315-318. Vienna. doi:10.1109/TSP.2016.7760887
  • Başbuğ, A. M. (2019). Ses olayı tanıma ve akustik sahne geri getirimi. Yüksek Lisans Tezi, Başkent Üniversitesi Fen Bilimleri Enstitüsü, Ankara.
  • Breiman, L. (2001). Random Forests. Machine Learning, 45, 5-32. doi:https://doi.org/10.1023/A:1010933404324 Bütüner, R. (2020). Yapay zeka yöntemleri ile bebek seslerinin tahmin edilmesi. Journal of Information Systems and Management Research, 2(1), 32-41.
  • Büyükarıkan, U. (2020). Finansal performansa etki eden finansal değişkenlerin CHAID karar ağacıyla belirlenmesi: tekstil sektörü örneği. Aydın İktisat Fakültesi Dergisi, 5(1), 1-10.
  • Dehak, N., Kenny, P., Dehak, R., Dumouchel, P. and Ouellet, P. (2011). Front-End Factor Analysis for Speaker Verification. IEEE Transactions on Audio, Speech, and Language Processing, 19(4), 788-798. doi:10.1109/TASL.2010.2064307
  • Eray, O. (2008). Destek vektör makineleri ile ses tanıma uygulaması. Yüksek Lisans Tezi, Pamukkale Üniversitesi Fen Bilimleri Enstitüsü, Denizli.
  • Garcia, J. O. and Reyes Garcia, C. A. (2003). Mel-frequency cepstrum coefficients extraction from infant cry for classification of normal and pathological cry with feed-forward neural networks. Proceedings of the International Joint Conference on Neural Networks, 3140-3145. Portland. doi:10.1109/IJCNN.2003.1224074
  • Güldal, H. ve Çakıcı, Y. (2017). Ders yönetim sistemi yazılımı kullanıcı etkileşimlerinin sınıflandırma algoritmaları ile analizi. Atatürk Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, 21(4), 1355-1367.
  • Karasartova, S. (2011). Metinden bağımsız konuşmacı tanıma sistemlerinin incelenmesi ve gerçekleştirilmesi. Yüksek Lisans Tezi, Ankara Üniversitesi Fen Bilimleri Enstitüsü, Ankara.
  • Kaynar, O., Görmez, Y., Yildiz, M. ve Albayrak, A. (2016). Makine öğrenmesi yöntemleri ile duygu analizi. International Artificial Intelligence and Data Processing Symposium, 234-241. Malatya.
  • Lavner, Y., Cohen, R., Ruinskiy, D. and IJzerman, H. (2016). Baby cry detection in domestic environment using deep learning. 2016 IEEE International Conference on the Science of Electrical Engineering (ICSEE), 1-5. Eilat. doi:10.1109/ICSEE.2016.7806117
  • Myakala, P. R., Nalumachu, R., Sharma, S. and Mittal, V. K. (2017). An intelligent system for infant cry detection and information in real time. 2017 Seventh International Conference on Affective Computing and Intelligent Interaction Workshops and Demos (ACIIW), 141-146. San Antonio. doi:10.1109/ACIIW.2017.8272604
  • Pal, P., Iyer, A. N. and Yantorno, R. E. (2006). Emotion detection from infant facial expressions and cries., 721-724. Toulouse. doi:10.1109/ICASSP.2006.1660444
  • Patil, M. S. and Kamerikar, U. A. (2018). Cause estimation of neonatal cry using raspberry pi. International Journal of Applied Engineering Research, 13(12), 10722-10726.
  • Reyes-Galaviz, O. F. and Reyes-Garcia, C. A. (2004). A system for the processing of infant cry to recognize pathologies in recently born babies with neural networks. 9th International Conference on Speech and Computer. St. Petersburg.
  • Reyes-García, C. A. (2006). Baby Chillanto Database. Mexican National Institute of Author Rights (INDAUTOR).
  • Rodriguez-Galiano, V. F., Ghimire, B., Rogan, J., Chica-Olmo, M. and Rigol-Sanchez, J. P. (2012). An assessment of the effectiveness of a random forest classifier for land-cover classification. ISPRS Journal of Photogrammetry and Remote Sensing, 67(0924-2716), 93-104. doi:10.1016/j.isprsjprs.2011.11.002
  • Saha, B., Purkait, P. K., Mukherjee, J., Majumdar, A. K., Majumdar, B. and Singh, A. K. (2013). An embedded system for automatic classification of neonatal cry. 2013 IEEE Point-of-Care Healthcare Technologies (PHT), 248-251. Bangalore. doi:10.1109/PHT.2013.6461331
  • Zabidi, A., Khuan, L. Y., Mansor, W., Yassin, I. M. and Sahak, R. (2010). Classification of infant cries with asphyxia using multilayer perceptron neural network. 2010 Second International Conference on Computer Engineering and Applications, 204-208. Bali. doi:10.1109/ICCEA.2010.47
Avrupa Bilim ve Teknoloji Dergisi-Cover
  • Yayın Aralığı: Yılda 4 Sayı
  • Başlangıç: 2013
  • Yayıncı: Osman Sağdıç
Sayıdaki Diğer Makaleler

Bebek Ağlamalarının Makine Öğrenmesi Yöntemleriyle Sınıflandırılması

Bengisu Şeyda KOP, Levent BAYINDIR

Sucul Bitki Lemna minor L. Üzerinde Fito-Sentezlenmiş Gümüş Nanopartikül Toksisitesi Etkisi

Zeynep İnci KOÇER, Melisa AYIŞIĞI, Selin HASEKİ, Lale AKTAŞ

Fenobucarb ve Klorbensit Pestisitlerinin Atıksu ve Göl Suyu Örneklerinde Gaz Kromatografi-Kütle Spektrometresi ile Tayini

Dotse Selali CHORMEY

Endüstri 5.0 (Toplum 5.0) ve Mimarlık

Elif Gizem YETKİN, Kemal COŞKUN

Tıbbı ve Aromatik Bitkiler Vadisi Tasarımı: Şanlıurfa Örneği

Hülya ÖZTÜRK TEL

Partikül Madde (PM10) Konsantrasyonunun Kentsel Yeşil Alan Sisteminin Değerlendirilmesinde Ekolojik İndikatör Olarak Kullanımı: İstanbul - Beşiktaş Örneği

Ahmet BATUR, Gül Aslı AKSU

Mobil Ağ Baz İstasyonlarının Değişim Noktalarının Uzun Dönem Sezonsallık Tespiti için Hibrid Bir Algoritma

Yakup KRANDA, Rüya ŞAMLI

Türkiye Kara Alanlarındaki Petrol ve Doğalgaz Kuyularında Kullanılan Sondaj Akışkanı Katkı Maddeleri ve Miktarları

Ahmet GÜLLÜ, Adil ÖZDEMİR, Yildiray PALABIYIK, Ergül YAŞAR

Yabancılara Türkçe Öğretiminde Geleneksel ve Teknoloji Temelli Yaklaşımların Değerlendirilmesi

Emre ÇALIŞKAN

Mor Şalgam (Brassica rapa L.) Kabuk Atıklarının Değerlendirilmesi: Ultrasonik Destekli Ekstraksiyon ile Polifenoliklerin Ekstraksiyonu ve in vitro Mide-Bağırsak Sindirim Sırasında Toplam Fenolik Madde, Toplam Monomerik Antosiyanin Miktarı ve Toplam Antioksidan Kapasitedeki Değişimin Araştırılması

Aysun YÜCETEPE