Dengesiz Kardiyak Aritmi Verilerinin Sınıflandırılması

Aritmiler kalp atışındaki düzensizliklerdir ve hayati tehlike yaratabilir. Kardiyak Aritminin erken teşhisi, hastaların hayatlarını kurtarmak için oldukça önemlidir. Bu çalışmada, asıl amaç EKG kayıtlarından kardiyak aritmi varlığının saptanması ve 16 gruba sınıflandırılmasıdır. UCI veri bankasındaki aritmi veri seti, sınıflandırma amacıyla farklı ağ yapılarını uygulamak için kullanılmıştır. Veri setinde her sınıfın örnek sayısı aynı değildir. Veri seti oldukça düzensiz bir sınıf dağılımıa sahiptir. Ayrıca, veri setinde bazı sınıflar mevcut değildir. Sınıflar arasındaki dengesiz dağılım, sınıflandırıcının performansında düşük sınıflandırma doğruluğu gibi azalmalara neden olur. Ayrıca çapraz geçerlilik sınaması (cross-validation) adımlarında, sınıflandırmadaki zorluğun üstesinden gelmek için veriler, her bir sınıftan aynı sayıda örnek içeren gruplara ayrılmıştır. Her sınıfın örnekleri, bu koşulu sağlamak için beş gruba bölünmüştür. Eğitim ve test veri setleri bu grupların bir kombinasyonu olarak elde edilmiştir. Veri kümesindeki dengesizlik durumuyla başa çıkmak amacıyla, ilk olarak, verileri sınıflandırmak için Çok Katmanlı Algılayıcı (MLP), Destek Vektör Makinesi (SVM), Radyal Temel Fonksiyon (RBF) ve Rastgele Orman (RF) gibi bazı tipik sınıflandırma algoritmaları kullanılmıştır. Sınıflandırıcıların kesinlik ve doğruluk performans ölçümlerine göre, genel doğruluğu artırmak için, her bir veri sınıfı için iç içe sınıflandırıcı yapıları oluşturulmuştur. Daha iyi bir sınıflandırıcı performansı elde etmek için farklı yapılar denenmiştir. Klasik ve önerilen dört yeni topluluk ağının (ensemble network) performansları karşılaştırma için sunulmuştur. Karşılaştırma sonuçları, rastgele orman sınıflandırıcısının doğruluk açısından en iyi performansa sahip olduğunu ve en yüksek doğruluğa sahip topluluk ağıyla bile hemen hemen aynı performans sonuçların alınabileceğini göstermiştir. Bu nedenle ilerideki çalışmalarda sınıflandırıcı performansının iyileştirilmesi için veri setinin arttırılması ve farklı ağ yapılarının uygulanması planlanmaktadır.

Classification of Imbalanced Cardiac Arrhythmia Data

Arrhythmias are irregularities in the heartbeat and can be life-threatening. Early diagnosis of Cardiac Arrhythmia is quite crucial for saving patient lives. In this study, the main goal is to detect the presence of cardiac arrhythmia and classify it into 16 groups from the ECG recordings. The arrhythmia dataset in the UCI databank is used to apply different network structures for classification. The number of sample of each class are not the same in the dataset. The dataset has a very immoderate class distribution, and moreover, some classes don't exist. The imbalance condition between the classes causes a decrement in the performance of the classifier such as low classification accuracy. Also, in the cross-validation steps, the data is divided into groups each of which includes the same number of samples from the classes to overcome this difficulty in the classification. The samples of each class are divided into five groups to satisfy that condition. The training and test datasets are obtained as a combination of these groups. To deal with the imbalance condition in the dataset, first, some typical classification algorithms as Multilayer Perceptron (MLP), Support Vector Machine (SVM), Radial Basis Function (RBF), and Random Forest (RF) are used to classify the data. According to the precision and accuracy performance measurements of the classifiers for each data class, the nested classifier structures are constructed to improve the overall accuracy. The different structures are tried to obtain a better classifier performance. The results of classical and proposed four new ensemble networks are presented to compare their performance. The result shows that the random forest classifier has the best performance in terms of accuracy and, even with the ensemble network having the highest accuracy can be obtained almost the same performance results. For this reason, it is planned to increase the dataset and apply the different network structures for the enhancement of classifier performance as to future work.

___

  • Mustaqeem, A., Anwar, S. M., & Majid, M. (2018). Multiclass Classification of Cardiac Arrhythmia Using Improved Feature Selection and SVM Invariants. Computational and Mathematical Methods in Medicine, 2018, 1–10. https://doi.org/10.1155/2018/7310496
  • Gupta, A., Banerjee, A., Babaria, D., Lotlikar, K., & Raut, H. (2021). Prediction and Classification of Cardiac Arrhythmia. Advances in Intelligent Systems and Computing.
  • Guvenir, H., Acar, B., Demiroz, G., & Cekin, A. (1997). A supervised machine learning algorithm for arrhythmia analysis. Computers in Cardiology 1997. https://doi.org/10.1109/cic.1997.647926
  • Azar, A. T., Elshazly, H. I., Hassanien, A. E., & Elkorany, A. M. (2014). A random forest classifier for lymph diseases. Computer Methods and Programs in Biomedicine, 113(2), 465–473. https://doi.org/10.1016/j.cmpb.2013.11.004
  • Sharifrazi, D., Alizadehsani, R., Roshanzamir, M., Joloudari, J. H., Shoeibi, A., Jafari, M., Hussain, S., Sani, Z. A., Hasanzadeh, F., Khozeimeh, F., Khosravi, A., Nahavandi, S., Panahiazar, M., Zare, A., Islam, S. M. S., & Acharya, U. R. (2021). Fusion of convolution neural network, support vector machine and Sobel filter for accurate detection of COVID-19 patients using X-ray images. Biomedical Signal Processing and Control, 68, 102622. https://doi.org/10.1016/j.bspc.2021.102622
  • Chicco, D., Tötsch, N., & Jurman, G. (2021b). The Matthews correlation coefficient (MCC) is more reliable than balanced accuracy, bookmaker informedness, and markedness in two-class confusion matrix evaluation. BioData Mining, 14(1). https://doi.org/10.1186/s13040-021-00244-z
Avrupa Bilim ve Teknoloji Dergisi-Cover
  • Yayın Aralığı: Yılda 4 Sayı
  • Başlangıç: 2013
  • Yayıncı: Osman Sağdıç
Sayıdaki Diğer Makaleler

Vardiya Çizelgeleme Optimizasyonu: Gerçek Hayat Yer Altı Taşımacılığı Örneği

Hafsa Nur ÖZTÜRK, Ediz ATMACA, Hatice ERDOĞAN AKBULUT, Esra AKTAŞ

[n] Kümesinin Ardışık İki Çift Tamsayı İçermeyen Alt Kümelerinin Sayısını Veren Tamsayı Dizisini Genelleyen Polinom Dizisi

Barış ARSLAN, Kemal USLU

Fasulye bitkisinde phospholipase D gen ailesinin tuz ve kuraklık stresi altında genom çaplı karakterizasyonu

Murat ISIYEL, Burak Muhammed ÖNER, Esra YAPRAK, Sümeyra UÇAR, Ayşe Gül KASAPOĞLU, Ahmed Sidar AYGÖREN, Selman MUSLU, Recep AYDINYURT, Emre İLHAN, Murat AYDIN

Strophoidal Yüzeyler

Erhan GÜLER, Ömer KİŞİ

Nor-wogonin’in İnsan Rahim Ağzı Kanseri Hücrelerinde Antikanser ve Apoptotik Etkileri

Ahmet KARAKUŞ, Sevgi ÜNAL KARAKUŞ

Aktif Mikroorganizmalar (EM) Kullanılarak İçme Suyundaki Çözünmüş Organik Maddenin Uzaklaştırılması

Zehra Gulten YALÇIN, Mustafa DAĞ, Ercan AYDOĞMUŞ

ZnO Kristalizasyonunun Morfolojisi, Boyut Dağılımı ve Yüzey Alanının Taguchi Deneysel Tasarımı Kullanılarak İncelenmesi

Muhammed Bora AKIN, Ömer Faruk DİLMAÇ, Barış ŞİMŞEK

On The Solutions of Three-Dimensional Difference Equation Systems Via Pell Numbers

Necati TAŞKARA, Hüseyin BÜYÜK

Baca Gazı Destekli Organik Rankine Çevrimi için Taguchi Analizi

Burak TÜRKAN

Türkiye’deki Jeotermal Enerji Santrallerinin Kümülatif Kurulu Gücünün Yapay Sinir Ağı ve İki Yönlü Uzun-Kısa Vadeli Bellek Kullanılarak Tahmini

Mehmet Hakan ÖZDEMİR, Batin Latif AYLAK