DAYANIKLI LİNEER DİSKRİMİNANT ANALİZİ İÇİN YENİ BİR YAKLAŞIM

Lineer diskriminant analizi, önceden bilinen p sayıdaki özelliklerine göre birimleri, doğadaki gerçek sınıflarına en doğru şekilde atamayı amaçlayan çok değişkenli istatistiksel bir yöntemdir. Burada hedef, birimleri gerçek sınıfına minimum hatayla atamaktır. Lineer Diskriminant Analizi (LDA), veri kümesinde diğer gözlemlerden farklı hareket eden ve aykırı gözlem olarak adlandırılan gözlemlerin varlığında dayanıklı bir yöntem değildir ve güvenilir sonuçlar vermeyebilir. Böyle durumlarda, klasik LDA’nın dayanıklı versiyonlarının kullanımının gerekliliği üzerine literatürde birçok çalışmaya rastlamak mümkündür. Bu çalışmada, jackknife yeniden örnekleme yaklaşımı, minimum kovaryans determinant (MKD) ve LDA yönteminin bir kombinasyonu ile LDA’nın yeni bir dayanıklı versiyonu elde edilmiştir.  Önerilen bu yeni yaklaşım ile Croux ve Dehon (2001) tarafından önerilen (Yöntem-1), Hawkins ve McLachlan (1997) tarafından önerilen (Yöntem-2) yaklaşımların aykırı gözlem oranındaki değişimlere göre nasıl etkilendiği yapay veri uygulaması ve benzetim çalışması üzerinden değerlendirilmektedir. Elde edilen bulgular ışığında, önerilen yaklaşımın diğer iki yaklaşıma göre, veri kümesinde aykırı gözlemlerin varlığında performansının bazı durumlarda daha iyi, bazı durumlarda ise en az onlar kadar iyi olduğu görülmektedir.

___

  • Alkan, B. B. (2016). Aykırı Gözlemlerin Varlığında Uyarlanmış En Küçük Kovaryans Determinant Tahminine Dayalı Dayanıklı Temel Bileşenler Analizi. Alphanumeric Journal, 4(2), 85-94.
  • Alrawashdeh, M. J., Radwan, T. R., & Abunawas, K. A. (2018). Performance of linear discriminant analysis using different robust methods. European Journal of Pure and Applied Mathematics, 11(1), 284-298.
  • Anderson, T.W. (1984). An introduction to multivariate statistical analysis. Second edition, New York, John Wiley & Sonsc Inc.
  • Atakan, C. (2003). Diskriminant Analizinde Gerçek Hata Oranına İlişkin Güven Aralığı için Bir Simülasyon Çalışması. Selçuk Üniversitesi Fen Fakültesi Fen Dergisi, 1(22), 89-96.
  • Croux, C. and Dehon, C. (2001). Robust linear discriminant analysis using s-estimators, The Canadian Journal of Statistics, 29, 473–492.
  • Croux, C., Filzmoser, P. and Joossens, K. (2008). Classification efficiencies for robust linear discriminant analysis. Statistica Sinica, 18(2):581–599.
  • Donoho, D. L., & Huber, P. J. (1983). The notion of breakdown point. A festschrift for erich l. lehmann, 157184.
  • Fisher, R. A. (1936). The use of multiple measurements in taxonomic problems. Annals of human genetics, 7(2), 179-188.
  • Hampel, ER. (1971). A general qua1itative definition of robustness, The Annals of Mathematical Statistics,42(6),1887-1896.
  • Hawkins, D.M. and McLachlan, G.J. (1997) High-Breakdown Linear Discriminant Analysis, Journal of the American Statistical Association, 92, 136–143.
  • Hubert, M. and Van Driessen, K. (2004). Fast and robust discriminant analysis, Computational Statistics and Data Analysis, 45, 301–320.Hubert, M., Rousseeuw, P. J., & Verdonck, T. (2012). A deterministic algorithm for robust location and scatter. Journal of Computational and Graphical Statistics, 21(3), 618-637.
  • Hubert M, Debruyne M, Rousseeuw PJ. (2017). Minimum covariance determinant and extensions. WIREs Comput Stat.;e1421.
  • Johnson, R. A., & Wichern, D. (2002). Multivariate analysis. John Wiley & Sons, Ltd.
  • Maronna, R. A., & Zamar, R. H. (2002). Robust estimates of location and dispersion for high-dimensional datasets. Technometrics, 44(4), 307-317.
  • Rousseeuw, Peter J, and Katrien Van Driessen. A fast algorithm for the minimum covariance determinant estimator. Technometrics, 41(3):212–223, 1999.
  • Rousseeuw, PJ. and Leroy, A. (1987). Robust Regression and Outlier Detection, John Wiley, NY, s.329.
  • Rousseeuw, P. J. (1984). Least median of squares regression. Journal of the American statistical association, 79(388), 871-880.
  • Rousseeuw, P. J., & Hubert, M. (2018). Anomaly detection by robust statistics. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 8:e1236.
  • Rousseeuw, P.J. and van Zomeren, B.C. (1991). Robust distances: Simulation and cutoff values. In: Directions in Robust Statistics and Diagnostics, Part II (W. Stahel and S. Weisberg, Eds.), Springer Verlag, New York.
  • Todorov, V. (2007). Robust selection of variables in linear discriminant analysis. Statistical Methods and Applications, 15(3), 395-407.
  • Todorov V. and Filzmoser P. (2009). An object oriented framework for robust multivariate analysis. Journal of Statistical Software, Vol. 32(3), pp. 1-47.
  • Todorov, V. and Pires, A.M. (2007) Comparative Performance of Several Robust Linear Discriminant Analysis Methods, REVSTAT Statistical Journal
  • Wiegand, P., Pell, R., & Comas, E. (2009). Simultaneous variable selection and outlier detection using a robust genetic algorithm. Chemometrics and Intelligent Laboratory Systems, 98(2), 108-114.