Türkiye’deki İllerin Ulaştırma Göstergelerine Göre Kümeleme Analizi Yöntemleriyle Sınıflandırılması

Bu çalışmada, Türkiye'deki illerin 2004-2018 yılları arasındaki ulaştırma göstergeleri veri setini oluşturan 40 adet değişken kullanılarak kümeleme analizi yöntemleri uygulanmıştır. Analizde kullanılan veri setinin uygunluğunu sağlamak üzere Öklid uzaklık ve Min-Max standartlaştırma ölçüleri kullanılmıştır. Çalışmada, ulaştırma göstergelerini oluşturan 40 adet değişken dikkate alınarak Türkiye’deki mevcut 81 İlin kümelenme yapısının ortaya konulması amaçlanmıştır. Tek-bağlantı yöntemi, kullanılan hiyerarşik yöntemler arasında kofenetik korelasyon katsayısı değerinin yüksekliği sebebiyle en başarılı yöntem olarak kabul edilerek sonuçları değerlendirilmiştir. Ayrıca hiyerarşik olmayan yöntemlerden olan k-ortalamalar yöntemi sonuçlarının incelenmesi ve yorumlaması yer almaktadır. Küme sayısı, küme geçerlilik indeksleri yardımı ile beş olarak belirlenmiştir. Elde edilen sonuçlar değerlendirildiğinde, ulaştırma göstergeleri bakımından büyük kent merkezlerine sahip illerde diğer illere göre daha belirgin farkların ortaya çıktığı görülmektedir.

Classificationof Provinces in Turkey by Clustering Analysis Methods According to Transport Indicators

In this study, constituting the transport indicators provinces in Turkey between the 2004-2018 year data set of 40 variables using cluster analysis methods were applied. Euclidean distance and Min-Max standardization measures were used to ensure the suitability of the data set used in the analysis. In the study, considering 40 variables constitute the transportation indicators available in Turkey 81 Province cluster is intended to reveal the structure. The single-connection method was accepted as the most successful method among the hierarchical methods used, due to the high value of the cophenetic correlation coefficient, and its results were evaluated. In addition, the analysis and interpretation of the results of the k-means method, which is one of the non-hierarchical methods, is included. The number of clusters was determined as five with the help of cluster validity indexes. Finally, it is seen that there are more distinct differences in transportation indicators in provinces with large city centers compared to other provinces.

___

  • Aggarwal, C. C., & Reddy, C. K. (2014). Data Clustering: Algorithms and Applications. Londra: Chapman ve Hall/CRC Data Mining and Knowledge Discovery Series.
  • Alpar, R., (2017). Uygulamalı Çok Değişkenli İstatistiksel Yöntemler. Ankara: Detay Yayıncılık.
  • Bulut, H., (2018). R Uygulamaları ile Çok Değişkenli İstatistiksel Yöntemler. Nobel Akademik Yayıncılık, Ankara, Türkiye.
  • Carvalho, P. R., Munita, C. S. ve Lapolli, A. L. (2019). Validity Studies Among Hierarchical Methods of Cluster Analysis Using Cophenetic Correlation Coefficient. Brazilian Journal of Radiation Sciences, 7(2A).
  • Charrad, M., Ghazzali, N., Boiteau, V. ve Niknafs, A. (2013). Nbclust R Package: Finding the Relevant Number of Clusters in a Dataset. J. Stat. Softw.
  • Erilli, N. A. (2009). Kümeleme Analizine Bulanık Yaklaşım Algoritmaları ve Uygulamaları, 19 Mayıs Üniv. Fen Bilimleri Enst., Yüksek Lisans Tezi, Samsun. Bilimleri Enst., Samsun.
  • Everitt, B. S. Landau, S., Leese, M. ve Stahl, D. (2011). Cluster Analysis. 5th Edition. United Kingdom: John Wiley and Sons. Ltd. 352
  • Grimm, L. G. ve Yarnold, P. R. (1995). Reading and Understanding Multivariate Statistics. USA: American Psychological Association.
  • Hair, J. F. Black, W. C., Babin, B. J., Anderson, R. E. ve Tatham, R. L. (2014). Multivariate Data Analysis. USA: Pearson.
  • İncekırık, A. (2005). Çok Değişkenli İstatistiksel Bir Boyut İndirgeme Yöntemi Olarak Kümeleme Analizi ve Bir Uygulama. (Yüksek Lisans Tezi). İzmir: Dokuz Eylül Üniversitesi Sosyal Bilimler Enstitüsü.
  • Johnson, R. A. ve Wichern, D. W. (2007). Applied Multivariate Statistical Analysis 6th Edition. Upper Saddle River, NJ: Prentice Hall.
  • Karadayı, E., Nalçakan, M., Gerede, E., Aras, H., Battal, Ü., & Şengür, F.K., (2012). Ulaştırma Sistemleri. Eskişehir: Anadolu Üniversitesi
  • Kassambara, A. ve Mundt, F. (2017). R Package ‘Factoextra’. Extract and Visualize the Results of Multivariate Data Analyses, 76.
  • Lessig, V. P. (1972). Comparing Cluster Analyses with Cophenetic Correlation. Journal Of Marketing Research, 9(1), 82-84.
  • Ligges, U., Maechler, M., Schnackenberg, S. ve Ligges, M. U. (2018). R Package ‘Scatterplot3d’. Recuperado De Https://Cran. Rproject. Org/Web/Packages/Scatterplot3d/Scatterplot3d. Pdf, (23.01.2021)
  • Macqueen, J. (1967, June). Some Methods for Classification and Analysis of Multivariate Observations. In Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability (Vol. 1, No. 14, Pp. 281-297).
  • Maechler, M., Rousseeuw, P., Struyf, A., Hubert, M., Hornik, K. ve Studer, M. (2013). R Package ‘cluster’. Dosegljivo na Revelle, W. ve Revelle, M. W. (2015). R Package ‘Psych’. The Comprehensive R Archive Network, 337, 338.
  • Rodrigue, J. P., Comtois, C. ve Slack, B. (2013). Transportation, Economy and Society. The Geography of Transport Systems, 3rd Edn. New York: Routledge.
  • Saraçlı, S., Doğan, N. ve Doğan, İ. (2013). Comparison of Hierarchical Cluster Analysis Methods by Cophenetic Correlation. Journal of Inequalities and Applications, 2013(1), 1-8.
  • Sarle, W. S. (1983). Cubic Clustering Criterion. SAS Institute.
  • Seber, G. A. (2009). Multivariate Observations. USA: John Wiley ve Sons, Inc.
  • Sharma, S. (1996). Applied Multivariate Techniques. USA: John Wiley ve Sons, Inc.
  • Sokal, R. R. ve Rohlf, F. J. (1962). The Comparison of Dendrograms by Objective Methods. Taxon, 11(2), 33-40.
  • Waters, D. (2003). Logistics an Introduction to Supply Chain Management. Londra: Palgrave Macmillan.
  • Wickham, H. ve Seidel, D. (2016). Scales: Scale Functions for Visualization. R Package Version 0.4.0, https://cran.r-project.org/web/packages/scales/index.html, (23.01.2021)