Üç duygu ile etiketlenmiş Türkçe ses kayıt verilerinin makine öğrenim algoritmalarıyla analizi

Duygu, insanın ruh halinde içsel ve çevresindeki etkilerle etkileşiminden doğan fiziksel değişimlerdir. Bireyler duygularını, beden dilinin yanı sıra sesli iletişim vasıtalarıyla da diğer bireylere aktarabilirler. Özellikle beden dilinin yetersiz olduğu durum ve zamanlarda bireyler için sesli iletişim önem kazanmaktadır. Çalışmamızda da Türkçe ses kayıtlarını içeren veri seti üzerinde Pyhton programlama dili aracılığıyla öncelikle verilerin duygu etiketlerinin tespiti yapılmış olup, sonrasında literatür çalışmalarında en çok kullanılan beş makine öğrenim algoritmasıyla analizler gerçekleştirilmiştir. Analizler hem Rapid Miner hem de Pyhton programlama dili aracılığıyla gerçekleştirilmiştir. Çalışmada, Pyhton programlama dili aracılığıyla yapılan analizlerde hem CountVectorizer hem de TF-IDF vektörizasyon yöntemleri, Rapid Miner ile yapılan analizlerde TF-IDF vektörizasyon yöntemi kullanılmıştır. Sonuç kısmında ise Pyhton programlama dilinde en iyi doğruluk oranını %70 oranla Naive Bayes makine öğrenim algoritması CountVectorizer yöntemiyle elde etmiştir. Rapid Miner’da ise en iyi doğruluk oranını %69,60 oranla Support Vector Machine makine öğrenim algoritması elde etmiştir. Çalışmamızla beraber ortaya yeni bir Türkçe duygu veri seti çıkmıştır. Çalışmamız ayrıca Türkçe ses kayıtlarından elde edilen verilerin BERT modeli ile duygu tespiti yapılan özgün bir çalışmadır

Analysis of Turkish audio recording data labeled with three emotions popular machine learning algorithms

Emotions are physical changes in a person's mood resulting from his interaction with internal and environmental influences. Individuals can convey their feelings to other individuals by means of voice communication as well as body language. Especially in situations and times when body language is insufficient, voice communication becomes important for individuals. In our study, the emotion labels of the data were firstly determined by the Python programming language on the data set containing the Turkish voice recordings, and then the analyzes were carried out with the five most used machine learning algorithms in the literature studies. Analyses were conducted through both Rapid Miner and the Pyhton programming language. In the study, both CountVectorizer and TF-IDF vectorization methods were used in analyses performed through the Pyhton programming language, and TF-IDF vectorization method was used in analyses performed with Rapid Miner. As a result, the best accuracy rate in the Pyhton programming language was achieved by the Naive Bayes machine learning algorithm CountVectorizer method with 70%. At Rapid Miner, the Support Vector Machine machine learning algorithm achieved the best accuracy rate of 69.60%.with our study, a new Turkish emotion dataset has emerged. Our study is also an original study in which emotion detection was done with the BERT model of the data obtained from Turkish voice recordings

___

  • Duygu - Vikipedi. https://tr.wikipedia.org/wiki/Duygu
  • Yapay Zeka, Makine Öğrenmesi ve Derin Öğrenme Kavramları Arasındaki Fark Nedir? - Evrim Ağacı. https://evrimagaci.org/yapay-zeka-makine-ogrenmesi-ve-derin-ogrenme-kavramlari-arasindaki-fark-nedir
  • S. Tuzcu, Çevrimiçi Kullanıcı Yorumlarının Duygu Analizi ile Sınıflandırılması.
  • J. Gondohanindijo, E. Noersasongko, Pujiono, Muljono, A. Z. Fanani, Affandy, R. S. Basuki, Comparison Method in Indonesian Emotion Speech Classification, 2019
  • O. Mohamad Nezami, P. Jamshid Lou, M. Karami, ShEMO: a large-scale validated database for Persian speech emotion detection, Lang. Resour. Eval., vol. 53, no. 1, Mar. 2019
  • R. Matin, D. Valles, A Speech Emotion Recognition Solution-based on Support Vector Machine for Children with Autism Spectrum Disorder to Help Identify Human Emotions, 2020
  • S. Dani, A. A. Mande, S. Telang, Z. Shao, Emotion Detection Using Audio Data Samples, Int. J. Adv. Res. Comput. Sci., vol. 10, no. 6, pp. 13–20, Dec. 2019
  • M. G. De Pinto, M. Polignano, P. Lops, G. Semeraro, Emotions Understanding Model from Spoken Language using Deep Neural Networks and Mel-Frequency Cepstral Coefficients, IEEE Conference on Evolving and Adaptive Intelligent Systems, May 2020
  • BERT Modeli ile Türkçe Metinlerde Sınıflandırma Yapmak | by Kemal Toprak Uçar | Medium. https://medium.com/@toprakucar/bert-modeli-ile-türkçe-metinlerde-sınıflandırma-yapmak
  • J.Devlin, M. Chang, K.Lee, K.Toutanova, BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding.
  • Machine Learning — Classification — Naive Bayes — Part 11 | by Ekrem Hatipoglu | Medium. https://medium.com/@ekrem.hatipoglu/machine-learning-classification-naive-bayes
  • 04.04. Naive Bayes Classifier - Erdinç Uzun. https://erdincuzun.com/makine_ogrenmesi/naive-bayes-classifier
  • K. Kirasich, T. Smith, B. Sadler, Random Forest vs Logistic Regression: Binary Classification for Heterogeneous Datasets, 2018
  • L. He, F. Kong, Z. Shen, Multiclass SVM based land cover classification with multisource data,2005
  • A. D. Kulkarni, B. Lowe, Random Forest Algorithm for Land Cover Classification International Journal on Recent and Innovation Trends in Computing and Communication Random Forest Algorithm for Land Cover Classification, 2016
  • Makine Öğrenimi Bölüm-4 (Destek Vektör Makineleri) | by E. Kaan Ulgen | Medium. https://medium.com/@k.ulgen90/makine-öğrenimi-bölüm-4-destek-vektör-makineleri
  • 04.05. Decision Tree (Karar Ağacı): ID3 Algoritması - Classification (Sınıflama) - Erdinç Uzun. https://erdincuzun.com/makine_ogrenmesi/decision-tree-karar-agaci-id3-algoritmasi-classification-siniflama
  • Makine Öğrenimi Bölüm-5 (Karar Ağaçları) | by E. Kaan Ulgen | Medium. https://medium.com/@k.ulgen90/makine-öğrenimi-bölüm-5-karar-ağaçları
  • Makine Öğrenimi Bölüm-2 (k-En Yakın Komşuluk) | by E. Kaan Ulgen | Medium. https://medium.com/@k.ulgen90/makine-öğrenimi-bölüm-2
Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi-Cover
  • ISSN: 1300-1884
  • Yayın Aralığı: 4
  • Başlangıç: 1986
  • Yayıncı: Oğuzhan YILMAZ
Sayıdaki Diğer Makaleler

Selenizza doğal asfaltının bitümlü bağlayıcının geleneksel ve reolojik özelliklerine etkisi

Baha KÖK, Erkut YALÇIN, Mehmet YİLMAZ, Barış BÜYÜK

Dizel bir motorun reaktivite kontrollü sıkıştırma ateşlemeli bir motora dönüşümünde farklı oranlarda propan kullanımının ve yanma başlangıç zamanının performans, emisyon ve silindir içi yanma karakteristiklerine olan etkilerinin incelenmesi

Fatih AKTAŞ, Nuri YÜCEL

Çift katmanlı cephelerin yangın güvenliği açısından incelemesi

Eylem Ezgi AŞLAR, Gülsu ULUKAVAK HARPUTLUGİL

İki boyutlu iki aşamalı kesme problemleri için matematiksel model tabanlı sezgisel yöntem

Banu İÇMEN ERDEM, Refail KASIMBEYLİ

CNN ve SVM yöntemleriyle çoklu-odaklı görüntü birleştirmede yeni bir hibrit yaklaşım

Samet AYMAZ

Yaya güzergahlarında erişilebilirlik düzeylerinin belirlenmesi: Çukurova Üniversitesi yerleşkesi örneği

Yelda DURGUN ŞAHİN, Berrin SİREL

Eksenel yükler altında bio-ilhamlı yapı dolgulu ince cidarlı alüminyum hibrit tüplerin çarpışma performanslarının incelenmesi

Murat ALTIN, Selin ARICI

Bina sertifikalandırma yöntemleri ve önerilen yeni bir yöntem: biyoharmolojik uygunluk değerlendirme

Cevdet Emin EKİNCİ

Optimum yalıtım kalınlığının entransy tabanlı çevre ve yaşam döngüsü maliyeti analizi ile belirlenmesi: Yakıt türünün etkisi

Uğur AKBULUT

Karayollarında gürültü bariyer sistemleri uygulanabilir potansiyel kesitlerin belirlenmesi

Nesimi ÖZKURT, Melike Neşe TEZEL OĞUZ, Deniz SARI, Samet Feyyaz HAMAMCI, Muhammet ERDÖL, Ece Gizem ÇAKMAK, Tuğba DOĞAN GÜZEL, Yağmur KABAKCI, Ömer Visali SARIKAYA, Mehmet Emin BİRPINAR, Eyyüp KARAHAN, Gürsel ERUL, İrde ÇETİNTÜRK GÜRTEPE, Nuray HÜSMEN, Esin TÜRKEL, Füsun GENÇER