Regresyon Analizinde Gözlemlerin Aykırı Değer Haritası ile Sınıflandırılması

Uygulamalarda, üzerinde çalışılan çok boyutlu veri kümeleri, genellikle verinin çoğunluğuna uymayan aykırı gözlemler içerir. Regresyon analizinin önemli aşamalarından bir tanesi de artık analizi ile bu aykırı gözlemleri doğru belirlemektir. Ancak, bu amaçla kullanılan klasik istatistiksel yöntemler aykırı değerlerden çok fazla etkilenir. Dolayısıyla klasik tahmin edicilere dayalı, artık analiz teknikleri araştırmacıyı yanlış yönlendirebilir. Bu çalışmada, çok boyutlu veri kümesindeki gözlemleri incelemek için kullanılan ve klasik tahmin ediciler yerine sağlam tahmin edicilere dayalı olarak oluşturulan aykırı değer haritası basitçe açıklanmıştır. Çalışmanın amacı ise, farklı tahmin ediciler kullanılarak oluşturulan regresyon modelleri ve bu modellere bağlı olarak elde edilen haritaları karşılaştırarak, hangi tahmin edicinin daha güvenilir aykırı değer haritası oluşturacağını tartışmaktır.

Classification of the Observations in Regression Analysis by Outlier Map

In practice, multidimensional data sets generally contain observations that deviate from the majority of data. One of the important stages of regression analysis is to correctly determine these observations by using residual analysis. However, conventional statistical methods used for this purpose are too much influenced by outliers. Therefore, the outlier analysis techniques based on classical estimators may mislead the investigator. In this study, outlier map which is used to examine observations in multidimensional data sets and generated by robust estimators instead of the classical estimators is briefly explained. The aim of this study is to compare outlier maps of different regression models generated by using different robust estimators and to discuss which robust estimator will create more reliable map.

___

  • Croux, C., 2007. Au Introduction to Robust Statistics: Mathematics and Practice. Lecture Notes, Faculty of Economics and Management, University Center of Statistics.
  • Dallal. G.E., Rousseeuw. P. J., 1992. LMSMVE A Program for Least Median of Squares Regression and Robust Distances. Computers and Biomedical Researches, Vol 25, 384-391.
  • Hubert. M., Rousseeuw, P. J., Aelst. S. V., 2008. High-Breakdown Robust Multivariate Methods, Statistical Science, Vol.23. No.l, 92- 119.
  • Rousseeuw. P. J., Leroy, A. M., 1987. Robust Regression and Outlier Detection, John Wiley & Sons, New York.
  • Rousseeuw. P. J., Van Zomeren, B. C., 1990. Unmasking Multivariate Outliers and Leverage Points. Journal of the American Statistical Association. Theory and Methods, Vol.85. No.411.
  • Verboven. S., Hubert. M., 2005. LIBRA: A MATLAB Library for Robust Aualysis. http://wis.kuleuven.be/stat/robust/LIBRA.html.