Destek Vektör Makineleri ve Naive Bayes Sınıflandırma Algoritmalarını Kullanarak Diabetes Mellitus Tahmini

Makine öğrenmesi, herhangi bir insan müdahalesi olmadan elde olan verilerden veya analizlerinden daha iyi sonuçlar elde edilmesine yardımcı olan alanlardan biridir. Ciddi ve karmaşık durumları analiz etmek ve doğruluk oranı yüksek tahminlerde bulunmak için son yıllarda gelişen teknolojiyle birlikte özellikte tıbbi teşhis alanında yaygın olarak kullanılmaktadır. Bu çalışma kapsamında Pima Indians Diyabet veri seti (Pima Indian Diabetes Dataset) üzerinde Naive Bayes ve Destek Vektör Makineleri (DVM) makine öğrenme algoritmaları kullanılarak diyabet hastalığı erken evrede teşhis edilmeye çalışılmıştır. Kullanılan sınıflandırıcıların performanslarını artırmak için veri setinde eksik değerler çarpıklık durumuna göre tekrar yapılandırılmış, veri standardizasyonu standart ölçeklendirme kullanılarak yapılmıştır. Ayrıca sınıf dengesizlik probleminin sınıflandırma üzerindeki olumsuz etkisini azaltmak için Sentetik Azınlık Aşırı-Örnekleme (SMOTE) tekniği kullanılmıştır. Çalışma kapsamında oluşturulan sınıflandırıcıların değerlendirme kriterleri Doğruluk Oranı (Accuracy Rate), Kesinlik (Precision), Duyarlılık (Recall) ve F1-Skore (F1 Score) metrikleri kullanılarak hesaplanmıştır. Destek Vektör Makineleri %90 doğruluk oranı ile en iyi sunucu vermiştir.

Prediction of Diabetes Mentillus by Using SVM and Naive Bayes Classification Algorithms

Machine learning is one of the fields that help to get better results from data or analysis without any human intervention. In recent years with the developing technology, it is widely used in the field of medical diagnosis, especially to analyze serious and complex situations and make predictions with high accuracy. In this study, it was tried to diagnose diabetic disease at an early stage by using Naïve Bayes and Support Vector Machines (DVM) machine learning algorithms on Pima Indians Diabetes Dataset. In order to increase the performance of the classifiers used, the missing values in the data set were restructured according to the skewness, and data standardization was done using standard scaling. Then, the Synthetic Minority Oversampling (SMOTE) technique was used to reduce the negative effect of class imbalance problem on classification. Evaluation criteria of the classifiers created within the scope of the study were calculated by using Accuracy Rate, Precision, Recall and F1-Score (F1 Score) values. According to these results, Support Vector Machines gave the best server with 88% accuracy rate.

___

  • https://www.who.int/health-topics/diabetes#tab=tab_1,21 Mayıs 2021 tarihinde alındı. (Erişim Tarihi: 31.05.2021).
  • Özlüer Başer, B. , Yangın, M. & Sarıdaş, E. S. (2021). Makine Öğrenmesi Teknikleriyle Diyabet Hastalığının Sınıflandırılması. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 25(1), 112-120. DOI: 10.19113/sdufenbed.842460.
  • Srinivasa R, Yashashwini, Shubham janakatti, Venkatesh K B, Yaswanth S P. (2020). Prediction of Diabetes using Machine Learning. International Journal of Advanced Science and Technology, 29(06), 7593 - 7601.
  • Kayaer, K., & Yıldırım, T. (2003). MEDICAL DIAGNOSIS ON PIMA INDIAN DIABETES USING GENERAL REGRESSION NEURAL NETWORKS. Proceedings of the International Conference on Artificial Neural Networks and Neural Information Processing, 2003.
  • Bilgin, G. (2021). Makine Öğrenmesi Algoritmaları Kullanarak Erken Dönemde Diyabet Hastalığı Riskinin Araştırılması . Journal of Intelligent Systems: Theory and Applications , 4 (1) , 55-64 . DOI: 10.38016/jista.877292.
  • Maniruzzaman, M., Rahman, M.J., Ahammed, B. (2020). Classification and prediction of diabetes disease using machine learning paradigm. Health Inf Sci Syst. 8, 7. https://doi.org/10.1007/s13755-019-0095-z.
  • Turhan, S., Yüksel, Ö., Şarer Yürekli, B. P., Suner, A., Doğu E. (2020) . Sınıf Dengesizliği Varlığında Hastalık Tanısı için Kolektif Öğrenme Yöntemlerinin Karşılaştırılması: Diyabet Tanısı Örneği. Türkiye Klinikleri Biyoistatistik Dergisi. 12 (1), 16-26. DOI: 10.5336/biostatic.2019-66816.
  • Nitesh V. Chawla, Kevin W. Bowyer, Lawrence O. Hall, and W. Philip Kegelmeyer. (2002. SMOTE). synthetic minority over-sampling technique. J. Artif. Int. Res. 16, 1 , 321–357
  • Cover, T. M. (1965). Geometrical and statistical properties of systems of linear inequalities with applications in pattern recognition. IEEE Trans. Electron. Comput. 14 (3), 326–334.
  • Cortes, C. and Vapnik, V. (1995) Support-Vector Networks. Machine Learning, 20, 273-297. http://dx.doi.org/10.1007/BF00994018.
  • Qi, Z., Tian, Y., & Shi, Y. (2013). Robust twin support vector machine for pattern classification. Pattern Recognit., 46, 305-316
Avrupa Bilim ve Teknoloji Dergisi-Cover
  • Yayın Aralığı: Yılda 4 Sayı
  • Başlangıç: 2013
  • Yayıncı: Osman Sağdıç
Sayıdaki Diğer Makaleler

Bitcoin Piyasa Değerinin Analizinde Veri Madenciliği Teknikleriyle Bir Öncü Gösterge Yaklaşımı

Özerk YAVUZ

Türkiye’de Yenilenebilir Kaynaklara Dayalı Elektrik Üretimini Etkileyen Faktörler: Rüzgar ve Güneş Enerjisi Örneğinde Kar Amacı Motivasyonuna göre Farklılaşan Engeller ve Destekler

Yelda ERDEN TOPAL, Betül Hande GÜRSOY HAKSEVENLER, Erkan ERDİL

Alüminyum Balpeteği Soğurucu Yüzeye Sahip bir Güneş Hava Kollektörünün HAD Analizi

Sharif EYYUBLU, Mahmut Sami BÜKER

Haşhaş Tohumu Yağından Elde Edilen Biyodizelin Motor Parametrelerine Etkisi

Süleyman ŞİMŞEK, Alper AYDIN, Hatice ŞİMŞEK

Osmaniye İlinde Sahipsiz Köpeklerin Rehabilitasyonu ve Viral Enfeksiyon Profilaksisi

Bilge Kaan TEKELİOĞLU, Hacer Burcu YÜCEER, Bünyamin AKIN, Özgür KOÇ, Mehmet ÇELİK, Sinan KANDIR, Ladine BAYKAL ÇELİK, Mahmut GÖKÇE

Geri Dönüştürülmüş Materyallerden Üretilen Bir Giysinin Satın Alımını Etkileyen Faktörlerin Dematel Yöntemi İle Değerlendirilmesi

Burak SARI, Derya TAMA BİRKOCAK, Meral İŞLER

CabApp: Taksi Yolculuğunuzu Doğru Tasarlayın

Yilmaz YÜCE, Ali ÇOBAN, Şerif İNANIR, Yalçın İŞLER

Otonom Araçların Benimsenmesi ve Güvenlik Algılarının İncelenmesi

Gözde BAKİOĞLU, Ali ATAHAN

PVSyst ile Konya İlinde Sabit ve Çift Eksenli Güneş Takip Sisteminin Modellenmesi

Ayşegül ETCİ, Ayşe BİLHAN

Yüzeyi Sertleştirilmiş S355J0 Çeliğinin MAG Yöntemiyle Birleştirilmesinde Koruyucu Gazın ve Kaynak Ağzının Mekanik Özelliklere Etkisi

Mücahit TÜRK, Ahmet DEMİRER