An evaluation of robust linear mixed models for Bivariate datasets with slash distributed residuals
Student’s-t ve Slash gibi bazı simetrik ve kalın kuyruklu dağılımlar, doğrusal karışık modellerde dirençli tahminler için önerilmektedir. Bu dirençli modeller bu dağılımların serbestlik dereceleri ile tanımlanmakta ve serbestlik derecesi sonsuza gittiğinde oluşan normal dağılımı da içermektedir. Bu simülasyon çalışmasında; Slash dağılımı gösteren hata terimli veri setlerinde, hata terimlerine ait serbestlik derecesi ile genetik ve genetik olmayan parametrelerin birlikte tahmini amaçlanmıştır. Kalın kuyruklu hata terimlerine sahip bivaryet veri setleri 4 veya 12 serbetlik dereceli Slash dağılımı kullanılarak türetilmiştir. Hata terimleri bivaryet Student’s-t, Slash ve normal olan modeller hiyerarşik Bayesian yaklaşımı kullanılarak her bir veri setine uygulanmıştır. Tahmini log likelihood değerleri, kalın kuyruklu dağılım gösteren veri setleri için Student’s-t ve Slash dağılımlı modellerin normal modele göre çok daha uygun olduğunu belirtmiştir. Serbestlik derecesinin ortalamasının yansız ve isabetli tahmin edildiği gözükmektedir. Baba ve sürü varyansları uygulanan modellerce aynı olmasada benzer olarak tahmin edilmiştir. Türetine veri setlerinde tahmin edilen hata varyanslarının ortalama ve %95 olasılık aralıkları da benzer bulundu. Serbestlik derecesinin güvenilir tahmini bütün veri setleri için elde edildi. Tahmini log-likelihood değeri de kalın kuyruklu dağılım gösteren veri setlerine uygulanan modeller arasında doğru modeli doğru şekilde belirledi.
Hata terimleri Slash dağılımı gösteren Bivaryet veri setlerinin dirençli doğrusal karışık modellerle değerlendirilmesi
Some symmetric and heavy-tailed distributions, such as Student’s-t and Slash, have been suggested for robust inference in linear mixed models. These robust models are characterized by the degrees of freedom of these distributions, and include the normal distribution when the degrees of freedom approach infinity. This simulation study investigated joint estimation of degrees of freedom for the residual and all other genetic and non-genetic parameters in the Slash distributed residual datasets. Bivariate data with heavy-tailed distributed residuals were generated using Slash distributions with 4 or 12 degrees of freedom. Models with bivariate Student’s-t, Slash and normal residuals were fitted to each dataset using a hierarchical Bayesian approach. Predictive log-likelihood values strongly favoured the bivariate Student’s-t and Slash models over the normal models for simulated heavy-tailed datasets. Posterior mean estimates of degrees of freedom parameters seemed to be accurate and unbiased. Estimates of sire and herd variances were similar, if not identical, across fitted models. Posterior mean and 95% posterior probability interval estimates of error variances in simulated datasets were found to be similar. Reliable estimates of degrees of freedom were obtained in all simulated datasets. The predictive log-likelihood was able to distinguish the correct model among the models fitted to heavy-tailed datasets.
___
- 1. Lange K, Sinsheimer JS: Normal/independent distributions and their applications in robust regression. J Am Stat Assoc, 2, 175-198, 1993.
- 2. Rosa GJM, Padovani CR, Gianola D: Robust linear mixed models with normal/ independent distributions and Bayesian MCMC implementation. Biom J, 45, 573-590, 2003.
- 3. Geman D, Geman S: Stochastic relaxation, Gibbs distributions, and the Bayesian restoration of images. IEEE Trans Pattern Anal Mach Intell, 6, 721-741, 1984.
- 4. Gelfand AE, Smith AFM: Sampling based approaches to calculating marginal densities. J Am Stat Assoc, 85, 398-409, 1990.
- 5. Gelfand AE: Model determination using sampling-based methods. In, Markov Chain Monte Carlo in Prac-tice. pp. 145-161, Chapman & Hall, London, U.K, 1996.
- 6. Raftery AE: Hypothesis testing and model selection. In, Markov Chain Monte Carlo in Prac-tice. pp. 163-187, Chapman & Hall, London, U.K, 1996.