Kayıp Veri ile Baş Etme Yöntemlerinin Madde Parametrelerine Etkisinin İncelenmesi

Bu araştırmada madde bazında kayıp veri oranlarının bulunduğu farklı örneklem büyüklüğündeki verilere ait madde ve test parametrelerinin kayıp veri ile baş etme yöntemlerinden nasıl etkilendiğini belirlemek amaçlanmıştır. PISA 2015 uygulamasına katılan ve çalışma içerisinde yer alan “hırs algısı” ölçeğine cevap veren 5073 öğrenci içerisinden rastgele seçilen 500, 100 ve 2500 öğrenci, araştırmanın çalışma grubunu oluşturmaktadır. Öncelikle her bir veri setinde normallik, tek boyutluluk, yerel bağımsızlık ve model-veri uyumu varsayımları incelenmiştir. Ölçekte 5 madde yer almaktadır ve kayıp veriler madde bazında oluşturulmuştur. Bu doğrultuda tamamen rastsal olacak şekilde her bir maddeden sırasıyla %5, %10, %15 ve %20’lik kayıp veriler oluşturulmuş, ölçek maddelerinden birinde ise hiç kayıp veri olmayacak şekilde analizler gerçekleştirilmiştir. Kayıp verilerin tamamen rastsal dağılım gösterdiği belirlendikten sonra öncelikle tam ve eksik verilerle; daha sonra silme, ortalama atama, yakın noktalar ortalama ataması, yakın noktalar medyan ataması, doğrusal değerleme, noktada doğrusal eğilim, regresyon atama ve beklenti maksimizasyonu yöntemleri sonucunda elde edilen tam veri setleri ile hesaplamalar gerçekleştirilmiştir. Hesaplama sürecinde betimsel istatistikler ve Cronbach-alfa güvenirlik katsayısı; ardından Madde Tepki Kuramına dayalı Aşamalı Tepki Modeline göre ayırıcılık ve güçlük indeksleri ile marjinal güvenirlik katsayısı hesaplanmıştır. Araştırma sonucunda madde ve test parametrelerinin eksik veriden ve kayıp veri ile baş etme yöntemlerinden etkilendiği; tam veri setine en yakın kestirimi sunan sonuçların doğrusal değerleme yöntemi ile elde edildiği belirlenmiştir.

Examination the Effect of Missing Data Techniques of Item Parameters

In this study, the aim is to determine how the item and test parameters affect the missing data techniques for different sample sizes and different items with different missing data rates. 500, 100 and 2500 students randomly selected from the 5073 students who participated in the PISA 2015 study and responded to the "ambition perception" scale included in the study constitute the study group of the research. First of all, the assumptions of normality, unidimensionality, local independence and model-data fit were examined for each data set. Afterwards, 5%, 10%, 15%, and 20% missing data were formed for four out of five items and there was no missing data in one item, then analyses were carried out. Once it is determined that the missing data are missing completely random, first with complete and incomplete data, then with serial mean, median of nearby points, mean of nearby points, linear interpolation, linear trend at point, regression, expectation maximization algorithm data item and test parameters were estimated. In the estimated process, descriptive statistics and cronbach alpha reliability coefficient and marginal reliability coefficient; the threshold parameters and the difficulty indices were estimated according to the graded response theory, which is one of the IRT models. The results of the study showed that the item and test parameters were influenced by incomplete and missing data techniques; it was determined that the best estimation results were obtained by linear interpolation method with different data.

___

  • Acar, T., ve Kelecioğlu, H. (2010). Maddenin farklı fonksiyonlaşmasını belirleme tekniklerinin karşılaştırılması: GADM, LR ve MTK-OO. Kuram ve Uygulamada Eğitim Bilimleri, 10(2), 639-649.
  • Akbaş, U. (2014). Farklı örneklem büyüklüklerinde ve kayıp veri örüntülerinde ölçeklerin psikometrik özelliklerinin kayıp veri baş etme teknikleri ile incelenmesi. Doktora Tezi, Ankara Üniversitesi Eğitim Bilimleri Enstitüsü, Ankara.
  • Akbaş, U. ve Tavşancıl, E. (2015). Farklı örneklem büyüklüklerinde ve kayıp veri örüntülerinde ölçeklerin psikometrik özelliklerinin kayıp veri baş etme teknikleri ile incelenmesi. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 6(1), 38-57.
  • Allison, P.D. (2002). Missing data. California: Sage Publication, Inc.
  • Bal, C. (2003). Çok gruplu veri setlerinde eksik gözlem sorununun çözümlenmesi ve sağlık alanında bir uygulama. Yayımlanmamış Yüksek Lisans Tezi, İstanbul Üniversitesi, Sağlık Bilimleri Enstitüsü, İstanbul.
  • Baygül, A. (2007). Kayıp veri analizinde sıklıkla kullanılan etkin yöntemlerin değerlendirilmesi. Yayımlanmamış Doktora Tezi, Osmangazi Üniversitesi, Sağlık Bilimleri Enstitüsü, Eskişehir.
  • Bernaards, C. A. ve Sijtsma, K. (2000). Influence of imputation and EM methods on factor analysis when item nonresponse in questionnaire data is nonignorable. Multivariate Behavioral Research, 35(3), 321 – 364.
  • Carpita, M., & Manisera, M. (2011). On the imputation of missing data in surveys with Likert-type scales. Journal of Classification, 28(1), 93-112.
  • Çokluk, Ö., Şekercioğlu, G., ve Büyüköztürk, Ş. (2014). Sosyal bilimler için çok değişkenli istatistik: SPSS ve LISREL uygulamaları. PegemA Akademi: Ankara.
  • Çokluk, Ö. ve Kayrı, M. (2011). Kayıp değerlere yaklaşık değer atama yöntemlerinin ölçme araçlarının geçerlik ve güvenirliği üzerindeki etkisi. Kuram ve Uygulamada Eğitim Bilimleri, 11(1), 289-309.
  • Çüm, S. ve Gelbal, S. (2015). Kayıp veriler yerine yaklaşık değer atamada kullanılan farklı yöntemlerin model veri uyumu üzerindeki etkisi. Mehmet Akif Ersoy Üniversitesi Eğitim Fakültesi Dergisi, 35, 87-111.
  • Demir, E. (2013). Kayıp verilerin varlığında çoktan seçmeli testlerde madde ve test parametrelerinin kestirilmesi: SBS örneği. Eğitim Bilimleri Araştırmaları Dergisi, 3(2), 48-68.
  • Demir, E., ve Parlak, B. (2012). Türkiye’de eğitim araştırmalarında kayıp veri sorunu. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 3(1).
  • Field, A. (2005). Discovering statistics with SPSS. California: Sage Publication, Inc.
  • Garrett, P. L., (2009). A Monte Carlo study investing ating missing data, differential item functioning and effect size. (Unpublished doctoral dissertation). Georgia State University.Atlanta.
  • Goegebeur, Y., De Boeck, P. ve Molenberghs, G. (2010). Person fit for test speededness: normal curvatures, likelihood ratio tests and empirical bayes estimates. Methodology: European Journal of Research Methods for the Behavioral and Social Sciences, 6(1), 3 – 16.
  • Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of item response theory (Vol. 2). California: Sage Publication, Inc.
  • Josse, J. ve Husson, F. (2012). Handling missing values in exploratory multivariate data analysis methods. Journal de la Société Française de Statistique, 153(2), 79-99.
  • Koçak, D. ve Çokluk Bökeoğlu, Ö. (2017). Kayıp veriyle baş etme yöntemlerinin model veri uyumu ve madde model uyumuna etkisi. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 8(2), 200-223.
  • Köse, A. ve Öztemur, B. (2014). Kayıp veri ele alma yöntemlerinin t-testi ve ANOVA parametreleri üzerine etkisinin incelenmesi. Abant İzzet Baysal Üniversitesi Eğitim Fakültesi Dergisi, 14(1), 400-412.
  • McNeish, D. (2016). Exploratory factor analysis with small samples and missing data. Journal of Personality Assessment, 99(6), 637-652.
  • Nartgün, Z. (2015). Kayıp veri sorununun çözümünde kullanılan farklı yöntemlerin farklı kayıp veri koşulları altında ölçeklerin psikometrik nitelikleri ve ölçme sonuçları bağlamında karşılaştırılması. Abant İzzet Baysal Üniversitesi Eğitim Fakültesi Dergisi, 7(4), 252-265.
  • Sezgin E. ve Çelik Y.(2013). Veri madenciliğinde kayıp veriler için kullanılan yöntemlerin karşılaştırılması, Akademik Bilişim Konferansı, Akdeniz Üniversitesi, 23-25 Ocak 2013.
  • Soysal, S. ve Akın Arıkan, Ç. (2017). Kayıp veri atama yöntemlerinin faktörleşme teknikleri üzerindeki etkisi. Küreselleşen Dünyada Eğitim, 22. Bölüm. PegemA Yayıncılık: Ankara.
  • Şahin Kürşad, M. ve Nartgün, Z. (2015). Kayıp veri sorununun çözümünde kullanılan farklı yöntemlerin ölçeklerin geçerlik ve güvenirliği bağlamında karşılaştırılması. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 6(2), 254-267.
  • Tabachnick, B. G. & Fidell, L. S. (2014). Using multivariate statistics. USA: Pearson Education Limited.
  • Weaver, B. ve Maxwell, H. (2014). Exploratory factor analysis and reliability analysis with missing data: A simple method for SPSS users. The Quantitative Methods for Psychology, 10(2), 143-152.
  • Witta, E. L. (2000). Comparison of missing data treatments in producing factor scores (rapor). Annual Meeting of the American Educational Resarch Association. Honolulu.
  • Yılmaz, H. (2014). Random forests yönteminde kayıp veri probleminin incelenmesi ve sağlık alanında bir uygulama. Yayımlanmamış Yüksek Lisans Tezi, Eskişehir Osmangazi Üniversitesi, Sağlık Bilimleri Enstitüsü, Eskişehir.