ATMOSFERİK PARTİKÜL MADDELERİN MAKİNE ÖĞRENMESİ İLE TAHMİNİ: BEŞİKTAŞ, İSTANBUL ÖRNEĞİ

Hava kirliliği, insan sağlığına ve çevreye olumsuz etkileri nedeniyle uzun yıllardır tartışılmakta olan bir problemdir. Bu problemi çözmek ve gereken önlemleri almak amacıyla hava kalitesinin değerlendirilmesi önem arz etmektedir. Hava kalitesi değerlendirilirken kirletici konsantrasyonları analiz edilerek, toplum açısından herkesin anlayabileceği bir indeks sistemi kullanılmaktadır. Ulusal Hava Kalitesi İndeksi kapsamında kalite indeksi hesaplanan beş temel kirleticiden biri, ciddi solunum yolu hastalıklarına sebep olan atmosferik partikül maddelerdir. Bu çalışmada çapı 2,5 mikrondan küçük olan ve PM2,5 olarak adlandırılan atmosferik partikül maddelerin oluşumunda trafik yoğunluğu, meteorolojik koşullar ve NOX, SO2, PM10 hava kirleticilerinin etkisi araştırılmıştır. Bu amaçla İstanbul Büyükşehir Belediyesi tarafından farklı alanlarda verilerin paylaşıldığı açık veri portalından yararlanılarak Beşiktaş bölgesindeki hava kalitesi izleme istasyonu incelenmiştir. Atmosferik partikül maddelerin tahmininde Çoklu Doğrusal Regresyon (ÇDR), Rassal Orman (RO), Destek Vektör Makineleri (DVM) ve Yapay Sinir Ağları (YSA) kullanılmıştır. Regresyon denkleminde farklı bağımsız değişkenlerin incelendiği farklı modeller geliştirilmiştir. Geliştirilen modeller ve kullanılan makine öğrenme algoritmaları determinasyon katsayısı (R2), düzeltilmiş R2, ortalama mutlak hata, ortalama hata karesi ve ortalama hata karesi kökü performans ölçütlerine göre karşılaştırılmıştır. Meteorolojik parametreler, trafik yoğunluğu, tarih ve PM10 konsantrasyonunun bağımsız değişken olarak kullanıldığı model, incelenen tüm performans ölçütlerine göre diğer modellere üstünlük sağlamıştır. Algoritmalar karşılaştırıldığında ise performans ölçütlerinin modellere göre değişiklik gösterdiği görülmüş ancak en iyi performans ortalamasına sahip teknik RO, en kötü performans ortalamasına sahip teknik ise ÇDR olarak bulunmuştur.

Prediction of Atmospheric Particulate Matter By Machine Learning: A Case Study of Beşiktaş, İstanbul

Air pollution is a problem that has been discussed for many years due to its negative effects on human health and the environment. It is important to evaluate air quality to eliminate all these negative effects and take the necessary precautions. When evaluating air quality, pollutant concentrations are analyzed and an index system that can be understood by everyone in the society is used. One of the five main pollutants whose quality index is calculated within the scope of the National Air Quality Index is atmospheric particulate matter, which causes serious respiratory diseases. In the study, the effects of traffic density, meteorological conditions, and NOX, SO2, PM10 pollutants on the formation of atmospheric particulate matter, which is less than 2.5 microns in diameter and called PM2,5 were investigated. For this purpose, the air quality monitoring station in Beşiktaş Region was examined by using the open data portal where data in different areas are shared by the Istanbul Metropolitan Municipality. Multiple Linear Regression (MLR), Random Forest (RF), Support Vector Machines (SVM) and Artificial Neural Networks (ANN) were used in the prediction of atmospheric particulate matter. Different models have been developed in which different independent variables were examined in the regression model. The developed models and the machine learning algorithms were compared according to coefficient of determination (R2), adjusted R2, mean absolute error, mean squared error and root mean square error performance criteria. The model, in which meteorological parameters, traffic density, date and PM10 concentration were used as independent variables, outperformed other models in terms of all performance criteria examined. When the results obtained were examined, it was seen that the algorithm performances varied according to the models. However, according to all performance criteria, the technique with the best average performance was found to be RF, while the technique with the worst performance average was found to be MLR.

___

  • Abiodun, O. I., Jantan, A., Omolara, A. E., Dada, K. V., Mohamed, N. A., Arshad, H., 2018, "State-of-the-art in artificial neural network applications: A survey". Heliyon, Cilt 4, Sayı 11, e00938.
  • Avrupa Çevre Ajansı, https://www.eea.europa.eu/data-and-maps/figures/air-quality-standards-under-the-1, ziyaret tarihi: 01.06.2022.
  • Başakın, E. E., Ekmekcioğlu, Ö., Özger, M., 2019, "Makine öğrenmesi yöntemleri ile kuraklık analizi". Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi, Cilt 25, Sayı 8, ss. 985-991.
  • Box, G., Jenkins, G., 1970, "Time series analysis: forecasting and control,(revised edition 1976) Holden-Day". San Francisco.
  • Bozdağ, A., Dokuz, Y., Gökçek, Ö. B., 2020, "Spatial prediction of PM10 concentration using machine learning algorithms in Ankara, Turkey". Environmental Pollution, Cilt 263, 114635.
  • Breiman, L., 2001, "Random forests". Machine learning, Cilt 45, Sayı 1, ss. 5-32.
  • Chen, G., Li S., Knibbs, L. D., Hamm, N. A., Cao, W., Li, T., Guo, J., Ren, H., Abramson, M. J., Guo, Y., 2018, "A machine learning method to estimate PM2.5 concentrations across China with remote sensing, meteorological and land use information". Science of the Total Environment, Cilt 636, ss. 52-60.
  • Cutler, A., Cutler, D. R., Stevens, J. R., 2012, Random forests. In: Ensemble machine learning. Eds: Springer, ss. 157-75.
  • Çelik, B., Arici, N., 2021, "Covid-19 Salgın Sürecinde Hava Kalitesi Tahmini: Zonguldak Örneği". Gazi Mühendislik Bilimleri Dergisi, Cilt 7, Sayı 3, ss. 222-232.
  • ÇİSİP (Çevre İklim ve Sağlık için İş birliği Projesi) Bilgi Notu, https://www.env-health.org/wp-content/uploads/2022/03/Hava_Kirliligi_Bilgi_Notu.pdf, ziyaret tarihi: 01.06.2022.
  • Demolli, H., Dokuz, A., Gokcek, M., Ecemiş, A., 2019, "Makine Öğrenmesi Algoritmalarıyla Güneş Enerjisi Tahmini: Niğde İli Örneği", International Turkic World Congress on Science and Engineering, ss. 783.
  • Dündar, D., Sariçiçek, İ., Çinar, E., Yazici, A., 2021, "Kestirimci Bakımda Makine Öğrenmesi: Literatür Araştırması". Eskişehir Osmangazi Üniversitesi Mühendislik ve Mimarlık Fakültesi Dergisi, Cilt 29, Sayı 2, ss. 256-76.
  • Dünya Sağlık Örgütü (World Health Organization, WHO), www.who.int/health-topics/air-pollution, ziyaret tarihi: 13.01.2022.
  • Edali, M., Yucel, G., 2018, "Automated analysis of regularities between model parameters and output using support vector regression in conjunction with decision trees", Jasss-The Journal Of Artıfıcıal Socıetıes And Socıal Sımulatıon, Cilt 21, Sayı 4.
  • Feurer, M., Hutter, F., 2019, Hyperparameter optimization. In: Automated machine learning. Eds: Springer, Cham, ss. 3-33.
  • García, S., Luengo, J., Herrera F., 2015, Data preprocessing in data mining, Springer, p.
  • Gültepe, Y., 2019, "Makine öğrenmesi algoritmaları ile hava kirliliği tahmini üzerine karşılaştırmalı bir değerlendirme". Avrupa Bilim ve Teknoloji Dergisi, Cilt 16, ss. 8-15.
  • Hall, M. A., 1999, "Correlation-based feature selection for machine learning".
  • Hsu, Y-H, Chuang, H-C, Lee, Y-H, Lin, Y-F, Chen, Y-J, Hsiao, T-C, Wu, M-Y, Chiu, H-W, 2019, "Traffic-related particulate matter exposure induces nephrotoxicity in vitro and in vivo", Free Radical Biology and Medicine, Cilt 135, ss. 235-44.
  • Hyndman, R. J., Athanasopoulos, G., 2018, Forecasting: principles and practice, OTexts, p.
  • İBB Meteoroloji Gözlem İstasyonu Veri Seti, https://data.ibb.gov.tr/dataset/meteorology-observation-station-data-set, ziyaret tarihi: 11.01.2022.
  • İBB Saatlik Trafik Yoğunluk Veri Seti, https://data.ibb.gov.tr/dataset/hourly-traffic-density-data-set, ziyaret tarihi: 11.01.2022.
  • İstanbul Büyükşehir Belediyesi, Veri setleri, https://data.istanbul/dataset, ziyaret tarihi: 11.01.2022.
  • Joseph, V. R., 2022, "Optimal ratio for data splitting". Statistical Analysis and Data Mining: The ASA Data Science Journal.
  • Kampa, M., Castanas, E., 2008, "Human health effects of air pollution". Environmental pollution, Cilt 151, Sayı 2, ss. 362-7.
  • Karsoliya, S., 2012, "Approximating number of hidden layer neurons in multiple hidden layer BPNN architecture". International Journal of Engineering Trends and Technology, Cilt 3, Sayı 6, ss. 714-7.
  • Kaynar, O., Tuna, M. F., Görmez, Y., Deveci, M. A., 2017, "Makine öğrenmesi yöntemleriyle müşteri kaybı analizi", Cumhuriyet Üniversitesi İktisadi ve İdari Bilimler Dergisi, Cilt 18, Sayı 1, ss. 1-14.
  • Kingma, D. P., Ba, J., 2014, "Adam: A method for stochastic optimization". arXiv preprint arXiv:1412.6980.
  • Koprinska, I., Rana, M., Agelidis, V. G., 2015, "Correlation and instance based feature selection for electricity load forecasting". Knowledge-Based Systems, Cilt 82, ss. 29-40.
  • Kuşkapan, E., Çodur, M. K., Çodur, M. Y., 2022, "Türkiye’deki Demiryolu Enerji Tüketiminin Yapay Sinir Ağlari İle Tahmin Edilmesi". Konya Mühendislik Bilimleri Dergisi, Cilt 10, Sayı 1, ss. 72-84.
  • Layanun, V., Suksamosorn, S., Songsiri, J., 2017, "Missing-data imputation for solar irradiance forecasting in Thailand", 2017 56th Annual Conference of the Society of Instrument and Control Engineers of Japan (SICE), ss. 1234-9
  • Li, L., Zhang, J., Wang, Y., Ran, B., 2018, "Missing value imputation for traffic-related time series data based on a multi-view learning method". IEEE Transactions on Intelligent Transportation Systems, Cilt 20, Sayı 8, ss. 2933-43.
  • Little, R. J., Rubin, D. B., 2019, Statistical analysis with missing data, John Wiley & Sons, p.
  • Mitchell, T. J., Beauchamp, J. J., 1988, "Bayesian variable selection in linear regression". Journal of the american statistical association, Cilt 83, Sayı 404, ss. 1023-32.
  • Namlı, E., Ramazan, Ü., Ecem, G., 2019, "Fiyat Tahminlemesinde Makine Öğrenmesi Teknikleri Ve Doğrusal Regresyon Yöntemlerinin Kıyaslanması; Türkiye’de Satılan İkinci El Araç Fiyatlarinin Tahminlenmesine Yönelik Bir Vaka Çalışması". Konya Mühendislik Bilimleri Dergisi, Cilt 7, Sayı 4, ss. 806-21.
  • Özmaden, M. Ş., Erdal, M., 2020, "Performance analysis of methods used in the cost estimation of residential buildings". Konya Mühendislik Bilimleri Dergisi.
  • Öztürk, A., Durak, Ü., Badilli, F., 2020, "Twitter verilerinden doğal dil işleme ve makine öğrenmesi ile hastalık tespiti". Konya Mühendislik Bilimleri Dergisi, Cilt 8, Sayı 4, ss. 839-52.
  • Parbat, D., Chakraborty M., 2020, "A python based support vector regression model for prediction of COVID19 cases in India". Chaos, Solitons & Fractals, Cilt 138, 109942.
  • Pearce, J. L., Beringer, J., Nicholls, N., Hyndman, R. J., Tapper, N. J., 2011, "Quantifying the influence of local meteorology on air quality using generalized additive models". Atmospheric Environment, Cilt 45, Sayı 6, ss. 1328-36.
  • Pénard-Morand, C., Annesi-Maesano, I., 2004, "Air pollution: from sources of emissions to health effects". Breathe, Cilt 1, Sayı 2, ss. 108-19.
  • Pujianto, U., Wibawa, A. P., Akbar, M. I., 2019, "K-nearest neighbor (k-NN) based missing data imputation", 2019 5th International Conference on Science in Information Technology (ICSITech), ss. 83-8
  • Sadriev, A. R., Kamaev, B. N., 2020, "Multivariate Prediction Model of Trade Diversity: Brics Countries". SCMS Journal of Indian Management, Cilt 17, Sayı 3.
  • Samuel, A. L., 1988, "Some studies in machine learning using the game of checkers. II—recent progress". Computer Games I, ss. 366-400.
  • Smola, A. J., Schölkopf B., 2004, "A tutorial on support vector regression". Statistics and computing, Cilt 14, Sayı 3, ss. 199-222.
  • Spławińska, M., 2015, "The problem of imputation of the missing data from the continuous counts of road traffic". Archives of civil engineering, Cilt 61, Sayı 1.
  • Suleiman, A., Tight M., Quinn A., 2019, "Applying machine learning methods in managing urban concentrations of traffic-related particulate matter (PM10 and PM2. 5)". Atmospheric Pollution Research, Cilt 10, Sayı 1, ss. 134-44.
  • Sürekli İzleme Merkezi (2022), https://sim.csb.gov.tr/Services/AirQuality, ziyaret tarihi: 11.01.2022. T.C. Çevre ve Şehircilik Bakanlığı (2019), 2020-2023 Ulusal Akıllı Şehirler Stratejisi ve Eylem Planı, https://www.akillisehirler.gov.tr/wp-content/uploads/EylemPlani.pdf, ziyaret tarihi: 23.01.2021.
  • T.C. Çevre, Şehircilik ve İkim Değişikliği Bakanlığı, Sürekli İzleme Merkezi, www.havaizleme.gov.tr, ziyaret tarihi:23.01.2021.
  • Uluslararası Telekomünikasyon Birliği (International Telecommunication Union, ITU), ITU Shaping smarter more sustainable cities, https://smartnet.niua.org/sites/default/files/resources/t-tut-smartcity-2016-1-pdf-e.pdf, ziyaret tarihi:23.01.2021.
  • Ünlü, O., Ünlü, H., Atay, Y., 2022, "Kalp Hastalığı Teşhisinde Yapay Zekâ Yöntemlerinin Kullanımı ve Karşılaştırılması". Konya Mühendislik Bilimleri Dergisi, Cilt 10, Sayı 2, ss. 396-411.
  • Zickus, M., Greig, A., Niranjan, M., 2002, "Comparison of four machine learning methods for predicting PM10 concentrations in Helsinki, Finland". Water, Air and Soil Pollution: Focus, Cilt 2, Sayı 5, ss. 717-29.