Çoklu doğrusal bağlantı durumunda doğrusal karma modelin kullanımı ve bir uygulama

Doğrusal Karma Model (DKM), doğrusal regresyon modelinin bir uzantısıdır ve sabit etkilere ilave olarak rastgele etkilerin modele eklenmesi durumunda ortaya çıkan istatistiksel bir modeldir. Son yıllarda, DKM’ler özellikle, aynı birimlerin zaman boyunca gözlemlenmesi ile edilen uzun süreli verilerin analizi için sık kullanılmaktadır. DKM, bir bağımlı değişken ve birden fazla bağımsız değişken arasındaki ilişkiyi homojen olmayan birimlerin birim-özel etkilerini hesaba katarak inceleyebilmektedir. Bu çalışmanın amaçları, literatürdeki çalışmalardan farklı olarak, zaman noktasının bir olduğu durumda DKM’in kullanımını araştırmak ve bağımsız değişkenlerin birbiriyle ilişkili olması olarak tanımlanan çoklu doğrusal bağlantı sorununun olması durumunda DKM ile çoklu doğrusal regresyon modelini karşılaştırmaktır. Bu çalışmada, 2015 yılında Uluslararası Öğrenci Değerlendirme Programı (PISA)’na katılan ülkelerin fen bilimleri okuryazarlığı ortalama puanları ve bu puanlar üzerinde etkisi olduğu düşünülen bazı sosyoekonomik değişkenlerin verileri kullanılarak, DKM ile bir modelleme çalışması yapılmış ve çoklu doğrusal bağlantı sorununun DKM ve çoklu doğrusal regresyon modeli ile hesaplanan parametre kestirimleri üzerinde nasıl bir etkisi olduğu incelenmiştir. Çoklu doğrusal bağlantı sorunu ortadan kaldırıldığında, çoklu doğrusal regresyon modeli ile DKM’in oldukça benzer sonuçlar verdiği görülmüştür.

Use of linear mixed model in multicollinearity and an application

A linear mixed model (LMM) is an extension of linear regression model to include both fixed effects and random effects. Recently, LMMs have been widely used especially for the analysis of longitudinal data taken from same subjects over time. The LMM can analyze the relationship between a dependent variable and two or more independent variables by taking into account subject-specific effects of nonhomogeneous subjects. Unlike previous studies, the aims of this study are to analyze the data taken at one time point by LMM and to compare LMM and multiple linear regression model in the presence of multicollinearity problem which occurs when two or more independent variables in the model are correlated with each other. We interpret the parameter estimates with application to the data set from Programme for International Student Assessment (PISA) in 2015. In this study, statistical analysis was performed for mean success scores of countries at science in PISA 2015 and data for some socioeconomic variables of countries which can be thought as factors affecting countries’ scores at science. A modeling study was conducted by taking into account of effect of multicollinearity problem. According to the findings of the study, both models have similar results without multicollinearity problem.

___