Rutin kan testleriyle COVID-19 tanı tahmininde makine öğrenmesi yöntemleriyle bir mobil uygulama geliştirilmesi

Amaç: Tüm dünya Aralık 2019'dan bu yana SARS-CoV-2 virüsü ile başa çıkmaya çalışmaktadır. Hastalığın erken belirtileri, soğuk algınlığı ve grip gibi diğer yaygın durumlarla örtüştüğünden, hekimler için erken tanının önemi büyüktür. Bu çalışmada, genel kullanıma açık anonim bir veri seti kullanılarak, rutin kan testleri sonuçları üzerinden Yeni Koronavirüs Hastalığı (COVID-19) tanısının (pozitif/negatif) makine öğrenmesi algoritmaları yardımıyla tahmin edilmesine yönelik bir mobil uygulama geliştirilmesi amaçlanmaktadır. Gereç ve Yöntem: Veri setinde yer alan, kayıp gözlem, sınıf dengesizliği, aykırı gözlem ve ilgisiz değişken problemleri giderildikten sonra makine öğrenmesi yöntemlerinin sınıflandırma performansları test edilmiş, ardından uygun değişkenlerle COVID-19 tanısı için lojistik regresyon modeli kurulmuştur. Bu model kullanılarak makine öğrenmesi tabanlı mobil uygulaması tasarlanmıştır. Bulgular: Tanı koymada en iyi sonuç veren değişkenler, eozinofil, lökosit, trombosit, monosit, kırmızı kan hücresi, bazofildir. Veri ön işleme problemleri giderildikten sonra kullanılan algoritmaların sınıflandırma performansları, ham verideki performans değerlerine göre oldukça yükselmiştir. Sonuç: Geliştirilen mobil uygulama ile rutin kan testi sonuçları kullanılarak, hızlı ve kolay bir şekilde Covid-19 tanısı tahmininde bulunulması mümkündür.

Development of a mobile application by using machine learning methods for the prediction of COVID-19 diagnosis with routine blood tests

bjective: The whole world has been dealing with the SARS-CoV-2 virus since December 2019. Early diagnosis is of great importance for physicians, as the early symptoms of the disease overlap with other common conditions such as cold and flu. In this study, we aimed to develop a mobile application to diagnose COVID-19 with machine learning algorithms that use anonymized publicly available routine blood tests results. Materials and Methods: After eliminating the missing observation, class imbalance, outlier observation, and unrelated variable problems in the data set, the classification performances of machine learning methods were tested, and then a logistic regression model was established for the detection of COVID-19 with appropriate variables. Using this model, a machine learning-based mobile application has been designed. Results: The variables that gave the best results in diagnosis were eosinophils, leukocytes, thrombocytes, monocytes, red blood cells, and basophils. After solving the data pre-processing problems, the classification performance of the algorithms used has increased considerably compared to the performance values in the raw data. Conclusion: With the developed mobile application, it is possible to estimate the diagnosis of Covid- 19 quickly and easily by using routine blood test results.

___

  • 1. WHO Coronavirus (COVID-19) Dashboard Website [cited 27 April 2021]. Available from: https://covid19.who.int/
  • 2. Alballa, N., & Al-Turaiki, I. Machine Learning Approaches in COVID-19 Diagnosis, Mortality, and Severity Risk Prediction: A Review. Informatics in Medicine Unlocked 2021; 100564.
  • 3. Zhou, Z. H. Ensemble methods: Foundations and algorithms. In Ensemble Methods: Foundations and Algorithms. 1st Edition. New York: Chapman and Hall/CRC. 2012..
  • 4. Zhou F, Yu T, Du R, et al. Clinical course and risk factors for mortality of adult inpatients with COVID-19 in Wuhan, China: a retrospective cohort study. The Lancet 2020; 395(10229):1054-62.
  • 5. Open Datasets and Machine Learning Projects|Kaggle [Internet]. Available from: https://www.kaggle.com/datasets
  • 6. García, Salvador, Julián Luengo, and Francisco Herrera. Data preprocessing in data mining. Vol. 72. Cham, Switzerland: Springer International Publishing, 2015.
  • 7. Demirarslan, M., & Suner, A. A Proposal of New Feature Selection Method Sensitive to Outliers and Correlation 2021; bioRxiv 2021.03.11.434934; doi: https://doi.org/10.1101/2021.03.11.434934
  • 8. Gislason, P. O., Benediktsson, J. A., & Sveinsson, J. R. Random Forests for land cover classification. Pattern Recognit Lett. 2005; 27 (4): 294-300. https://doi.org/10.1016/j.patrec.2005.08.011
  • 9. Ke, G., Meng, Q., Finley, T., et al. LightGBM: A highly efficient gradient boosting decision tree. Adv Neural Inf Process Syst. 2017; 30: 3146-54.
  • 10. Chen, T., & Guestrin, C. XGBoost: A Scalable Tree Boosting System. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp. 785–94). New York, NY, USA: ACM; 2016 https://doi.org/10.1145/2939672.2939785
  • 11. Prokhorenkova, L., Gusev, G., Vorobev, A., Dorogush, A.V. and Gulin, A. CatBoost: unbiased boosting with categorical features. Adv Neural Inf Process Syst. 2018; 31.
  • 12. Breiman,L. Bagging predictors. Machine Learning 1996; 24 (2): 123–40. https://doi.org/10.1007/bf00058655.
  • 13. Ian Goodfellow, Yoshua Bengio, A. C. Deep Learning Book. Deep Learning 2015 https://doi.org/10.1016/B978-0-12-391420-0.09987-X.
  • 14. Powers D. Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation. J of Machine Learn Tech 2011; 2 (1): 37-63.
  • 15. Delgado R & Tibau X-A. Why Cohen’s Kappa should be avoided as performance measure in classification. PLoS ONE 2019; 14 (9): e0222916. https://doi.org/10.1371/journal.pone.0222916
  • 16. Cohen J. A Coefficient of Agreement for Nominal Scales. Educ Psychol Meas. 1960; 20 (1): 37-46. https://doi.org/10.1177/001316446002000104
  • 17. Yavaş M, Güran A, ve Uysal M. Covid-19 Veri Kümesinin SMOTE Tabanlı Örnekleme Yöntemi Uygulanarak Sınıflandırılması. Avrupa Bilim ve Teknoloji Dergisi. 2020:258-64. https://doi.org/10.31590/ejosat.779952
  • 18. Banerjee A, Ray S, Vorselaars B, et al. Use of Machine Learning and Artificial Intelligence to predict SARS- CoV-2 infection from Full Blood Counts in a population. Int Immunopharmacol 2020; 86: 106705. https://doi.org/10.1016/j.intimp.2020.106705
  • 19. Yaşar, Ş. & Çolak, C. A Proposed Model Can Classify the Covid-19 Pandemic Based on the Laboratory Test Results. Journal of Cognitive Syst 2020; 5 (2): 60-3.
Ege Tıp Dergisi-Cover
  • ISSN: 1016-9113
  • Yayın Aralığı: Yılda 4 Sayı
  • Başlangıç: 1962
  • Yayıncı: Ersin HACIOĞLU
Sayıdaki Diğer Makaleler

Kolorektal kanserin karaciğer metastazında sağ kalımı etkileyen faktörler

Osman BOZBIYIK, Ahmet ÇOKER

Millard-Gubler Sendromlu bir olguda şaşılık ve okuloplasti cerrahisi

Derya ÖZKAN, Osman Bulut OCAK, Hilal Zeynep CEYLAN, Birsen GÖKYİĞİT, Muhittin TAŞKAPILI

Erişkin bir hastada pulmoner sekestrasyon

Özge CAN, Cihat PINARCI, Selen BAYRAKTAROĞLU

Radyolojik bulgularıyla nadir bir pediatrik olgu: pelvik kistik şıvannom

Ahmat Kasım KARABULUT, Gonca KOC, Emre DİVARCI, Javid NAGHİYEV, Recep SAVAS

Kök hücreler kanser hücrelerinin mikroçevresindeki sitokin yanıtlarını etkiler: Meme kanseri ve dental pulpa kök hücreleri arasındaki etkileşim

Sayra DİLMAÇ, Mustafa Gökhan ERTOSUN, Eda AÇIKGÖZ, Gamze TANRIÖVER

Yaşlı bireylerin kronik ağrıyla baş etme durumları ve etkileyen faktörlerin incelenmesi

Kadriye SAYIN KASAR, Hülya KANKAYA, Emine KARAMAN

Oosit toplama sırasındaki folikül yıkamanın fertilite prezervasyonu siklusları sonuçlarına etkisi, retrospektif çalışma

Volkan EMİRDAR, Ferruh ACET

Anormal laboratuvar parametrelerine ilave olarak, nötrofil-lenfosit, monosit-lenfosit ve trombosit-lenfosit oranlarının COVID-19 pnömonisindeki önemi

Nermin KENİ BEGENDİ, Fatma KAÇAR, Mikail DAĞ, Arzu TARAKÇI, Şule ÖZDEMİR ARMAĞAN, Fatih SAÇKAN, Muhammet Cemal KIZILARSLANOĞLU

Günübirlik anestezi uygulamalarımız ve gelişen komplikasyonlar

Cengiz ŞAHUTOĞLU, Nursel KARACA, Semra KARAMAN, Nüzhet Seden KOCABAŞ, Işık ALPER, Meltem UYAR, Fatma Zekiye AŞKAR

Laktobasillerden elde edilen hücresiz süzüntülerin metisiline dirençli Staphylococcus aureus, vankomisine dirençli Enterococcus ve karbapeneme dirençli Klebsiella suşlarını inhibisyonu

Fatma KALAYCI YÜKSEK, Defne GÜMÜŞ, Derya BAYIRLI TURAN, Yaşar NAKİPOĞLU, Rıza ADALETİ, A. Mine KÜÇÜKER