İngilizce Yeterlik Sınavı Puanlarının Üç Farklı Eşitleme Yöntemine Göre Karşılaştırılması

İngilizce yeterlik sınavları, her yıl farklı sorulardan oluşan testlerle yapılmaktadır. Bu sınavlarda kesme puanı değişmemesine karşın, sınava giren öğrenciler farklı formlardan farklı puan alabilmektedir. Bu çalışmada, İngilizce yeterlik sınavında kullanılan testlerin birbirine eşdeğer olup olmadığı, eşdeğer değilse, test eşitleme yöntemleriyle farklı sınavlara ait alınan puanların birbirine dönüştürülmesi ve testlerin birimlerinin aynı olmasının sağlanması hedeflenmiştir. İngilizce yeterlik sınavında kullanılan testler ortak test desenine dayalı üç farklı yöntemle eşitlenmiştir. Eşitlemede kullanılan yöntemler, Klasik Test ve Örtük Özellikler kuramlarına dayalıdır. Klasik test kuramına göre; eşit yüzdelikli ve doğrusal, örtük özellikler kuramına göre; Rasch parametresinin karakteristik eğri yöntemleri kullanılmıştır. Veriler Hacettepe Üniversitesi İngilizce Hazırlık Bölümü’nün yaptığı 2000, 2001 ve 2002 sınavlarının sonuçlarıdır. Analiz aşamasında betimsel istatistikler, örtük özellikler kuramı ve eşitleme varsayımlarıdan yararlanılarak farklı yıllara ait puanlar doğrusal, eşit yüzdelikli ve Rasch modeliyle eşitlenmiştir. Sonuçta, İngilizce yeterlik sınavında kullanılan testlerin eşitlenmesinde Rasch yöntemi ve eşit yüzdelikli eşitleme yönteminin uygun yöntemler olduğu bulunmuştur.

A Comparison of the Results of English Proficiency Exams Through Three Different Equation Methods

English profiency exams are executed through questions that change every year. Even though cut of point does not change in these exams, students taking these test are likely to get different results different forms which puts the student in advantageous or a disadvantageous position. In this study, the main aim is to measure If the test are equal, If not, to make different scores of different tests interchangeable so as to make the units of tests equal and to compare levels of groups of test takers of different years. To attain this aim, test used in English language profiency exams are equalized with the help of three different test designs and two theories titled Classical test and Item Response Theories. As for the Classical test theory, equapercentage and linear, and for Item Response Theory Rasch Parametry characteristic curve method are used. Data used in this research process are gathered from the test results conducted in the years of 2000, 2001, 2002 at Hacettepe University English Language Preparatory School. As the result, it was found that while equating the tests used in English Profiency tests, Rasch method and equapercentage equation method were applicable and proper methods.

___

  • Akhun, İ. (1984) . İki Korelasyon Katsayısı Arasındaki Farkın Manidarlığının Test Edilmesi. A..Ü. Eğt. Bil. Fak. Dergisi, 17-12.
  • Angoff, W. H. (1971). Scales, Norms and Equivalent Scores. R. L Thorndike (Ed.) Educational Measurement. Washington D.C: American Council on Education.
  • Angoff, W. H. (1982). Summary and Derivations of Equating Methods Used at ETS, in Holland Test Eguating, New York Academic Press 55- 59.
  • Baykul, Y. (2000). Eğitimde ve Psikolojide Ölçme: Klasik Test Teorisi ve Uygulaması, Ankara: ÖSYM Yayınları.
  • Braun, H. I. ve Holland, P.W. (1982). Observed score test equating. A mathematical analysis of same ETS equating procedure. New York: Academic Press.
  • Croker, L. ve Algina, J. (1986). Introduction to Classical and Modern Theory. CBS College Publishing.
  • Hambelton, G. (1985). Item Response Theory: Principles and Aplication, Kluwer, Nijhoff Kluwer Academic Publisher Group.
  • Petersen, N. S., Macro, G. L ve Stewart, E. E. (1982). A test adequacy of linear scores equating methods. New York: Academic Press.
  • Woodroff, D. (1986). Derivations of Observed Score Linear Equating Methods Based On Test Score Models for the Common Item Nonequavalent Population Design. Journal of Educational Satistics, 11, 245-257.
  • Woodroff, D. (1989). A comparison of Three Linear Equating Methods for the Comman Item Nonequivalent: Population Design. Applied Psychological Measurement 13, 257 – 261.