Türkiye’de Covid-19 günlük vaka sayısının makine öğrenmesi algoritmaları ile tahmin edilmesi

COVID-19 enfeksiyonu 2019 yılının Aralık ayında ortaya çıkmış olup, Dünya Sağlık Örgütü tarafından 11 Mart 2020’de pandemi olarak tanımlanmıştır. Pandemi sürecinde vaka sayılarının kontrol altına alınması için sosyal alanlarda kısıtlama ve sokağa çıkma yasağı gibi önlemler alınmıştır. Pandemi sürecinde vaka sayılarına yönelik tahminlerin yapılması önemlidir. Vaka sayısı tahmininin yapılmasında kullanılan zaman serisi analizi, bölmeli model ve makine öğrenmesi gibi kullanılan tahminleme yöntemleri bulunmaktadır. Bu araştırmada COVID-19 vaka sayısının tahmin edilmesinde Destek Vektör Makinesi Algoritması (SVM), Karar Ağacı Algoritması (DT), Naif Bayes Algoritması (NB), K-En Yakın Komşu Algoritması (KNN) ve Rastgele Orman Algoritması (RF) olarak 5 makine öğrenme algoritması üzerinde çalışılmıştır. Algoritmaların tahmin performansı doğruluk, duyarlılık ve kesinlik değerleri ile belirlenmiştir. PCA yöntemi kullanıldığında doğruluk değeri en yüksek RF algoritmasında, duyarlılık ve kesinlik değeri en yüksek SMV algoritmasında saptanmıştır. Bu yöntemin kullanılması sonucunda en düşük doğruluk NB algoritmasında, duyarlılık ve kesinlik değerleri en düşük NB ve DT algoritmalarında elde edilmiştir. PCA yöntemi kullanıldığında tüm algoritmalarda doğruluk, duyarlılık ve kesinlik değerleri AVM’ler Açık/Kapalı veri setinde en yüksek düzeyde bulunmuştur. Okullar Açık/Kapalı, Restaurantlar Açık/Kapalı ve AVM’ler Açık/Kapalı veri setinde RF algoritması ile tahminde sırasıyla %95, %88 ve %90 başarı oranı bulunmuş iken; Sokağa Çıkmak Yasak verisi için DT Algoritması ile tahminde %85 başarı oranı elde edilmiştir.

Prediction Covid-19 cases per day with machine learning algorithms in Turkey

COVID-19 infection emerged in December 2019 and was defined as a pandemic by the World Health Organization on March 11, 2020. During the pandemic process, measures such as restrictions in social areas and curfews have been taken. It is important to make estimates for the number of cases during the pandemic process. There are estimation methods used in estimating the number of cases, such as time series analysis, divisional model and machine learning. In this research, 5 machines as Support Vector Machine Algorithm (SVM), Decision Tree Algorithm (DT), Naive Bayes Algorithm (NB), K-Nearest Neighbor Algorithm (KNN) and Random Forest Algorithm (RF) were used to estimate the number of COVID-19 cases. The prediction performance of the algorithms was determined by the accuracy, sensitivity and precision values. When the PCA method is used, the RF algorithm has the highest accuracy and the SMV algorithm has the highest sensitivity and precision. As a result of using this method, the lowest accuracy was obtained in the NB algorithm, and the lowest sensitivity and precision values were obtained in the NB and DT algorithms. When the PCA method was used, the accuracy, sensitivity and precision values in all algorithms were found at the highest level in the AVMs On/Off dataset. In the Schools On/Off, Restaurants On/Off and Shopping Malls On/Off data set success rates were found respectively 95%, 88% and 90% in estimating with the RF algorithm. In the Curfew data, 85% success rate was achieved in the estimation with the DT Algorithm.

___

  • Awan, T. M., Aslam, F. (2020). Prediction of daily COVID-19 cases in European countriesus ingautomatic ARIMA model. Journal of Public Health Research, 9(3).
  • Gorbalenya, A.E., Baker, S.C., Baric, R.S. (2020). Covid-19&Ct. Published online. Jin, X., Bie, R., (2006). Random Forest and PCA for Self-Organizing Maps based Automatic Music Genre Discrimination. In DMIN, 414-417.
  • McCoy, T. H., Pellegrini, A. M., Perlis, R. H., (2018). Assessment of time-series machine learning methods for forecasting hospital discharge volume. JAMA network open, 1(7), 87
  • Nash, C. M., (2020). Harvard Professor Sounds Alarm on ‘Likely’Coronavirus Pandemic: 40% to 70% of World Could Be Infected This Year, JAMA, 1(5).
  • Özen, N. S., Saraç, S., Koyuncu, M. (2021). COVID-19 Vakalarının Makine Öğrenmesi Algoritmaları ile Tahmini: Amerika Birleşik Devletleri Örneği. Avrupa Bilim ve Teknoloji Dergisi, (22), 134-139.
  • Papacharalampous, G. A., Tyralis, H., (2018). Evaluation of random forests and Prophet for Daily stream flow forecasting. Advances in Geosciences, 45, 201-208.
  • Rustam, F., Reshi, A. A., Mehmood, A., Ullah, S., On, B. W., Aslam, W., Choi, G. S. (2020). COVID-19 future forecasting using supervised machine learning models. IEEE access, 8, 101489-101499.
  • Sahai, A. K., Rath, N., Sood, V., Singh, M. P. (2020). ARIMA modelling & forecasting of COVID-19 in top five affected countries. Diabetes&Metabolic Syndrome: Clinical Research & Reviews, 14(5), 1419-1427.
  • Salehi, S., Abedi, A., Balakrishnan, S., Gholamrezanezhad, A. (2020). Coronavirus disease 2019 (COVID19): a systematic review of imaging findings in 919 patients. American Journal of Roentgenology, 215(1), 87-93.
  • Sevli, O., Gülsoy, V. G. B., (2020). Covid-19 Salgınına Yönelik Zaman Serisi Verileri ile Prophet Model Kullanarak Makine Öğrenmesi Temelli Vaka Tahminlemesi. Avrupa Bilim ve Teknoloji Dergisi, (19), 827-835.
  • World Health Organization. Coronavirus Disease (COVID-2019) (2021). Situation Reports, World Health Organization, 2021.
  • Zhou, F., Yu, T., Du, R., Fan, G., Liu, Y., Liu, Z., Cao, B., (2020). Clinical course and risk factors for mortality of adult in Patients with COVID-19 in Wuhan, China: a retrospective cohort study. The lancet, 395(10229), 1054-1062.