Çok Değişkenli Normal Dağılımların Karmasına Dayalı Kümelemede TOPSIS Yöntemiyle ile Küme Sayısının Belirlenmesi

Çok kriterli karar verme (ÇKKV) yöntemleri, birden fazla kriterin optimizasyonu ile mümkün çözüm kümeleri içerisinden alternatifin seçimi, sıralanması ve sınıflanmasını sağlar. Bu çalışmanın amacı, ÇKKV yöntemlerinden birisi olan TOPSIS (Technique for Order Preference by Similarity to Ideal Solution) ile modele dayalı kümeleme analizinde küme sayısını belirlemektir. Çalışmada, veri setleri aday küme sayılarına göre modele dayalı kümeleme ile modellenmiş ve elde edilen her bir kümeleme için Akaike bilgi kriteri (AIC), kanıtların yaklaşık ağırlık kriteri (AWE), Bayesci bilgi kriteri (BIC), sınıflandırma olabilirlik kriteri (CLC) ve Kullback bilgi kriteri (KIC) birer karar kriteri olarak hesaplanmıştır. Kriterlerin ağırlıklandırılmasın da simülasyon sonuçları kullanılmış olup TOPSIS ile veri seti için en uygun küme sayısı belirlenmiştir Önerilen yaklaşımın başarısı gerçek ve sentetik veri setleri üzerinde test edilmiştir. Uygulama sonucunda uygun küme sayısının belirlenmesinde önerilen yaklaşım ilgili bilgi kriterlerine göre daha başarılı bir performans göstermiştir.

___

  • [1] Titterington, D.M., Smith, A. F., Makov, U. E. 1985. Statistical analysis of finite mixture distributions, Wiley.
  • [2] Pearson, K. 1894. Contributions to the mathematical theory of evolution, Philosophical Transactions of the Royal Society of London. A, 185, 71-110.
  • [3] Wolfe, J. H. 1965. A computer program for the maximum likelihood analysis of types, Naval Personnel Research Activity San Diego Calif.
  • [4] Wolfe, J. H. 1967. NORMIX: Computational methods for estimating the parameters of multivariate normal mixtures of distributions, Naval Personnel Research.
  • [5] Day, N. E. 1969. Estimating the components of a mixture of normal distributions, Biometrika, 56 (3), 463-474.
  • [6] Binder, D. A. 1978. Bayesian cluster analysis, Biometrika, 65 (1), 31-38.
  • [7] Dempster, A. P., Laird, N. M., Rubin, D. B. 1977. Maximum likelihood from incomplete data via the EM algorithm, Journal of the royal statistical society. Series B (methodological), 1-38.
  • [8] Celeux, G., Govaert, G. 1993. Comparison of the mixture and the classification maximum likelihood in cluster analysis, Journal of Statistical Computation and simulation, 47 (3-4), 127-146.
  • [9] Celeux, G., Govaert, G. 1995. Gaussian parsimonious clustering models, Pattern recognition, 28 (5), 781-793.
  • [10] Fraley, C., Raftery, A. E. 2002. Model-based clustering, discriminant analysis, and density estimation, Journal of the American statistical Association, 97 (458), 611-631.
  • [11] Biernacki, C., Celeux, G., Govaert, G. 2003. Choosing starting values for the EM algorithm for getting the highest likelihood in multivariate Gaussian mixture models. Computational Statistics & Data Analysis, 41(3-4), 561-575.
  • [12] McLachlan, G., Peel, D. 2004. Finite mixture models, John Wiley & Sons.
  • [13] Pernkopf, F., Bouchaffra, D. (2005). Genetic-based EM algorithm for learning Gaussian mixture models. IEEE Transactions on Pattern Analysis and Machine Intelligence, 27(8), 1344-1348.
  • [14] Raftery, A. E., Dean, N. 2006. Variable selection for model-based clustering. Journal of the American Statistical Association, 101(473), 168-178.
  • [15] Browne, R. P., McNicholas, P. D. 2012. Model-based clustering, classification, and discriminant analysis of data with mixed type. Journal of Statistical Planning and Inference, 142(11), 2976-2984.
  • [16] Yang, M. S., Lai, C. Y., Lin, C. Y. 2012. A robust EM clustering algorithm for Gaussian mixture models. Pattern Recognition, 45(11), 3950-3961.
  • [17] Lee, S. X., McLachlan, G. J. 2013. Model-based clustering and classification with non-normal mixture distributions. Statistical Methods & Applications, 22(4), 427-454.
  • [18] Kwedlo, W. 2015. A new random approach for initialization of the multiple restart EM algorithm for Gaussian model-based clustering. Pattern Analysis and Applications, 18(4), 757-770.
  • [19] Malsiner-Walli, G., Frühwirth-Schnatter, S., Grün, B. 2016. Model-based clustering based on sparse finite Gaussian mixtures. Statistics and computing, 26(1-2), 303-324.
  • [20] Marbac, M., Biernacki, C., Vandewalle, V. 2017. Model-based clustering of Gaussian copulas for mixed data. Communications in Statistics-Theory and Methods, 46(23), 11635-11656.
  • [21] Fop, M., Murphy, T. B. 2018. Variable selection methods for model-based clustering. Statistics Surveys, 12, 18-65.
  • [22] Scrucca, L., Raftery, A. E. 2018. clustvarsel: a package implementing variable selection for Gaussian model-based clustering in R. Journal of Statistical Software, 84.
  • [23] Celeux, G., Maugis-Rabusseau, C., Sedki, M. 2019. Variable selection in model-based clustering and discriminant analysis with a regularization approach. Advances in Data Analysis and Classification, 13(1), 259-278.
  • [24] Wei, Y., Tang, Y., McNicholas, P. D. 2019. Mixtures of generalized hyperbolic distributions and mixtures of skew-t distributions for model-based clustering with incomplete data. Computational Statistics & Data Analysis, 130, 18-41.
  • [25] Gögebakan, M., Servi, T. 2019. Genetik Algoritma Kullanılarak Verilerin Karma Normal Modele Dayalı Kümelenmesi. Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi, 35(3), 12-23.
  • [26] Bozdogan, H. 1994. Mixture-model cluster analysis using model selection criteria and a new informational measure of complexity, Proceedings of the first US/Japan conference on the frontiers of statistical modeling: An informational approach, 69-113.
  • [27] Oliveira-Brochado, A., Martins, F. V. 2005. Assessing the number of components in mixture models: a review, Universidade do Porto, Faculdade de Economia do Porto.
  • [28] Akogul, S., Erisoglu, M. 2016. A comparison of information criteria in clustering based on mixture of multivariate normal distributions. Mathematical and Computational Applications, 21(3), 34.
  • [29] Akaike, H. 1998. Information theory and an extension of the maximum likelihood principle. In Selected papers of hirotugu akaike (pp. 199-213). Springer, New York, NY.
  • [30] Banfield, J. D., Raftery, A. E. 1993. Model-based Gaussian and non-Gaussian clustering. Biometrics, 803-821.
  • [31] Schwarz, G. 1978. Estimating the dimension of a model. The annals of statistics, 6(2), 461-464.
  • [32] Biernacki, C., Govaert, G. 1997. Using the classification likelihood to choose the number of clusters. Computing Science and Statistics, 451-457.
  • [33] Cavanaugh, J. E. 1999. A large-sample model selection criterion based on Kullback's symmetric divergence. Statistics & Probability Letters, 42(4), 333-343.
  • [34] Yıldırım, B. F., Önder, E., Turan, G. 2015. Operasyonel, Yönetsel ve Stratejik Problemlerin Çözümünde Çok Kriterli Karar Verme Yöntemleri. Dora Yayıncılık, 2, 15.
  • [35] Akogul, S., Erisoglu, M. 2017. An approach for determining the number of clusters in a model-based cluster analysis. Entropy, 19(9), 452.
  • [36] Özdemir, B., Özcan, B., Aladağ, Z. 2017. Güneş enerjisi santrali kuruluş yerinin AHS ve VIKOR yöntemlerine dayalı bütünleşik yaklaşım ile değerlendirilmesi. Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi, 33(2), 16-34.
  • [37] Zararlı, F., Yazgan, H. R., Delice, Y. 2018. AHP ve VIKOR Bütünleşik yaklaşımıyla Lojistik Merkez Yer Seçimi: Kayseri ili örneği. Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi, 34(3), 1-9.
  • [38] Hwang, C. L., Yoon, K. 1981. Methods for multiple attribute decision making. In Multiple attribute decision making (pp. 58-191). Springer, Berlin, Heidelberg.
  • [39] Lai, Y.-J., Liu, T.-Y., Hwang, C.-L. 1994. Topsis for MODM, European journal of operational research, 76 (3), 486-500.
  • [40] Wang, T. C., Lee, H. D. 2009. Developing a fuzzy TOPSIS approach based on subjective weights and objective weights. Expert systems with applications, 36(5), 8980-8985.
  • [41] Ishizaka, A., Nemery, P. 2013. Multi-criteria decision analysis: methods and software, John Wiley & Sons, p.
  • [42] Akman, G., Özcan, B., Başlı, H., Gündüz, E. B. 2018. Çok Kriterli Karar Vermede AHP ve TOPSIS Yöntemleriyle Uçuş Noktası Seçimi. Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi, 34(3), 45-57.
  • [43] Lichman, M. 2013. UCI Machine Learning Repository, University of California, Irvine, School of Information and Computer Sciences, http://archive.ics.uci.edu/ml: (Erişim Tarihi: 06.06.2016).