A STUDY OF RAVEN STANDARD PROGRESSIVE MATRICES TEST'S ITEM MEASURES UNDER CLASSIC AND ITEM RESPONSE MODELS: AN EMPIRICAL COMPARISON1

Bu araştırmada, Raven Standart lerlemeli Matrisler Testine (RS MT) ait madde parametreleri, Klasik Test Kuramı (KTK) ve Madde Tepki Kuramı (MTK) modelleri altında kestirilerek, görgül yakla ımla kar ıla tırılmı tır. Bulgular, KTK ve MTK na dayalı olarak kestirilen test madde güçlük ölçülerinin birbirleriyle kar ıla tırılabilir olduklarını bu kar ıla tırmada özellikle üç parametreli modelin klasik modelle en yüksek ili kileri verdi ini göstermi tir. Di er taraftan iki kurama dayalı olarak kestirilen madde ayırıcılık de erleri arasındaki ili ki çok dü ük veya eksi de erli çıkmı , bu parametreler iki kuram arasında kar ıla tırılabilir bulunmamı tır. Her iki kurama dayalı olarak kestirilen madde güçlük ölçüleri örneklemler arası “de i mezlik” özelli i gösterirken, madde ayırıcılık ölçüleri örneklemler arasında farklı de erler vermi lerdir. Görgül verilere dayalı olarak yürütülen bu çalı manın bulgularına genel olarak bakıldı ında, KTK’ nın “de i mez “ madde ölçüleri üretmede ba arısız olmadı ını göstermi tir. Di er taraftan, RSIMT nin kullanılabilece i, bilgisayarlı bireyselle tirilmi test uygulaması, test e itleme gibi bazı test uygulamalarında, özellikle iki parametreli model tercih edilebilir

The present paper is subject to study and compare empirically item measures of Raven Standard Progressive Matrices (RSPM) Test under Classic Test Theory (CTT) and Item Response Theory (IRT) Models. The findings of research showed that estimated Raven items’ difficulty indexes from CTT were very comparable with those from all IRT models and with the three-parameter model. But compared with item difficulty indexes, the item discrimination indexes from CTT were somewhat less comparable with those from IRT. Both CTT and IRT item difficulty indices (especially two- and three-parameter model) exhibited high invariance across samples. Both CTT and IRT item discrimination indexes which did not exhibit invariance across samples were analysed according to Classical-based and Item response based indices respectively. In general, the findings from this empirical investigation failed to discredit the CTT framework with regard to its alleged inability to produce invariant item statistics. On the other hand, if the RSPM will be used in some testing applications, such as computerized adaptive testing, test equating, IRT models will be preferable, especially two- parameter model

Keywords: