Veri Madenciliği: Makine Öğrenme Algoritmaları ile Türkiye’nin İşsizlik Oranı Tahminini Etkileyen Faktörlerin Tespit Edilmesi

İşsizlik oranı, bir ülkenin ekonomik verimini ölçen en önemli değişkenlerden biridir. İş gücü ve verimi toplumun gelişmesi açısından çok önemli olup, işsizlik oranının düşürülmesi ve istihdam sağlanması bir devletin büyümesi açısından kilit öneme sahiptir. İşsizlik oranının tahmin edilmesi alınacak önlemler ve planlamalar açısından önem arz etmektedir. Bu çalışmada, işsizlik oranının tahmini için Türkiye İstatistik Kurumunun (TÜİK) İllerde Yaşam Endeksi verilerinden ve TÜİK tarafından oluşturulan veri gruplarından yararlanılmıştır. Tahmini etkileyen değişkenlerin tespiti için veri madenciliği sürecinden ve makine öğrenme algoritmalarından yararlanılmıştır. Bu çalışma kapsamında, işsizlik oranının tahmininde hangi tür veri gruplarının daha etkili olduğu ve hangi makine öğrenme yöntemlerinin daha etkin olduğu sorgulanmıştır. Elde edilen sonuçlar tahmin duyarlılık analizi kapsamında incelenmiş ve hata oranlarına göre yorumlanmıştır. Elde edilen sonuçlara göre işsizlik oranı tahmininde, Genel Regresyon Sinir Ağı (GRNN) yöntemi Destek Vektör Makineleri (SVM) ve Gen İfadesi Programlama (GEP) yöntemlerine göre daha etkin bir yöntemdir. Ayrıca, eğitim konulu veri grubunun diğer veri gruplarından daha etkili olduğu gözlemlenmiştir.

Data Mining: Identifying Factors Affecting Turkey's Unemployment Rate Estimation with Machine Learning Algorithms

The unemployment rate is one of the most important variables that measure the economic efficiency of a country. Labor force and efficiency are very important for the development of society, reducing the unemployment rate and providing employment are key to the growth of a state. Estimating the unemployment rate is important in terms of measures and plans to be taken. In this study, for the estimation of the unemployment rate, data from the Life Index in Provinces of the Turkish Statistical Institute (TUIK) and data groups created by TUIK were used. Data mining process and machine learning algorithms were used to determine the variables affecting the estimation. Within the scope of this study, it has been questioned which types of data groups are more effective in estimating the unemployment rate and which machine learning methods are more effective. Obtained results were analyzed within the scope of estimation sensitivity analysis and interpreted according to error rates. According to the results obtained, General Regression Neural Network (GRNN) method is a more effective method than Support Vector Machines (SVM) and Gene Expression Programming (GEP) methods in estimating unemployment rate. In addition, it was observed that the education-themed data group was more effective than the other data groups.

___

  • Bağcı, B. (2020) “Gri Markov Modeli ile Türkiye'de İşsizlik Oranı Tahmini”, Sosyal Güvenlik Dergisi, 10 (2) ss. 259-272
  • Buckley J.J, (2004) Fuzzy Statistics, Springer, Germany. ISBN 3-540-21084-9
  • Carbonell, G.J., Gil, Y. (1987, Haziran) “Learning by Experimentation” Proceedings of the Fourth International Workshop on Machine Learning, 256-266.
  • Chen S.Y., Liu X. (2004) “The contribution of data mining to information science” Journal of Information Science, vol 30, no 6. pp. 550–558
  • Çiftçi, C. (2016) “Forecastıng of Unemployment Rate For Turkey: Markov Chaıns Aproach”, Eurasian Academy of Sciences Eurasian Business & Economics Journal, Vol. S2, 657-665, http://dx.doi.org/10.17740/eas.econ.2016-MSEMP-140
  • Dener, M., Dörterler M., Orman A. (2009, Şubat)“Açık Kaynak Kodlu Veri Madenciliği Programları: WEKA’da Örnek Uygulama” Akademik Bilişim’09- XI. Akademik Bilişim Konferansı Bildirileri, Harran Üniversitesi, Şanlıurfa, ss. 787-796.
  • DTREG, Gene Expression Programming [Çevrimiçi]. https://www.dtreg.com/methodology/view/gene-expression-programming Erişim: 2021a
  • DTREG, General Regression Neural Networks [Çevrimiçi]. https://www.dtreg.com/solution/probabilistic-and-general-regression-neural-networks Erişim: 2021b
  • DTREG, Support Vector Machines, [Çevrimiçi]. https://www.dtreg.com/solution/support-vector-machines Erişim: 2021c
  • Gil-Alina L.A., Ozdemir Z.A., Tansel A. (2019) “Long Memory in Turkish Unemployment Rates”, Emerging Markets Finance and Trade (35) 201-217 (Published online: 27 Jul 2018), https://doi.org/10.1080/1540496X.2018.1425837
  • Gong, L., Lei, H., & Zhu, L. (2012, May). The application of association rules of data mining in book-lending service. In 2012 9th International Conference on Fuzzy Systems and Knowledge Discovery (pp. 761-764). IEEE.
  • Günay S., İçen D. (2015) “Türkiye’deki İssizlik Oranının Bulanık Doğrusal Regresyon Analiziyle Tahmini”, İstatistikçiler Dergisi: İstatistik & Aktüerya, IDIA 8, 10-26
  • Kobu, B. (2017) Talep Tahminlerinde Duyarlılık, Üretim Yönetimi, 18.baskı, Beta Basım Yayım Dağıtım, İstanbul, Türkiye, 120-125
  • M. Gülenay Chadwick and G. Şengül, (2015) “Nowcastıng The Unemployment Rate in Turkey: Let’s Ask Google”, Central Bank Review (15) 15-40, ISSN 1303-0701
  • Ngai, E.W.T., Xiu, L., Chau, D.C.K. (2009) “Application of data mining techniques in customer relationship management: A literature review and classification” Expert Systems with Applications, 36, (2). 2592–2602
  • Pradhan A., (2012) “Support Vector Machine-A Survey” International Journal of Emerging Technology and Advanced Engineering, 2 (8), 82-85
  • Resmi İstatistik, İllerde Yaşam Endeksi, [Çevrimiçi]. Erişim: http://www.resmiistatistik.gov.tr/detail/subject/illerde-yasam-endeksi/
  • Türkiye İstatistik Kurumu, TÜİK (2016a), Yaşam Memnuniyeti Araştırması amaç, [Çevrimiçi]. Erişim: ]https://tuikweb.tuik.gov.tr/MicroVeri/YMA_2016/metaveri/amac/index.html
  • Türkiye İstatistik Kurumu, TÜİK (2016b) Yaşam Memnuniyeti Araştırması kapsam [Çevrimiçi]. Erişim: https://tuikweb.tuik.gov.tr/MicroVeri/YMA_2016/metaveri/kapsam/index.html
  • Tüzemen A., Yıldız Ç. (2018) “Holt Winters Tahminleme Yöntemlerinin Karşılaştırmalı Analizi: Türkiye İşsizlik Oranları Uygulaması” Atatürk Üniversitesi İktisadi ve İdari Bilimler Dergisi, 32, (1), 1-18
  • Yıldırım H., Başeğmez H. (2017) “Analysis and forecast of Turkey unemployment rate”, Global Journal of Mathematical Analysis, vol 1, no 1. 11-15,. doi: 10.14419/gjma.v5i1.6841
  • Yolcu U., Eren B. (2016) “The Forecasting Of Labour Force Participation And The Unemployment Rate In Poland And Turkey Using Fuzzy Time Series Methods Comparative” Economic Research, 19, (2), doi: 10.1515/cer-2016-0010