Basit doğrusal regresyon modellerinde anormal gözlemlerin testi: Cook istatistiği

Doğrusal Regresyon modellerinde anormal gözlemlerin bulunması işlemi son yıllarda önemli bir merak konusu olmuştur. Bu çalışmada; basit doğrusal regresyon problemlerindeki anormal gözlemlerin testinde kullanılan Cook İstatistiği önerilmiştir. Anormal gözlemler ekstrem değerlerdir. Student türü residual grafiklerinde anormal gözlemler, sıfırdan yaklaşık olarak dört, beş veya daha fazla standart sapma uzaklıktadırlar. Bu gözlemler literatürde; anormal değerler, düzensiz gözlemler, kuraldışı değerler, başıboş değerler ve çirkin veriler olarak adlandırılmışlardır. Bu çalışmada bıldırcınlardan elde edilen yumurta boylan $X_i$ bağımsız değişkeni olarak ve yumurta ağırlıklanda $Y_i$ gözlem değeri olarak kullanılmıştır. Sonuçta; bir gözlem Cook İstatistiği Metodu ile anormal gözlem olarak teşhis edildi.

Testing for outliers from a simple linear regression: Cook's statistics

The detecting outliers has considerable attracted on the linear regression models in recent years. In this study Cook's Statistics Method which are used in detecting of outliers, in a simple linear regression have been performed. Outliers are extreme observations. In a studentized residual plot, outliers are far from zero about four, five or more standart deviations. These observations have been called as rogue values, contaminants, surprising values, mavericks and dirty data in the literature. In this study the length of eggs that was obtained the quails was used as $X_i$ independent variables and the weights of eggs was used as $Y_i$ observation values. As a result; one observation was detected as an outlier in this data by Cook's Statistics Method.

___