Ability Level Estimation of Students on Probability Unit via Computerized Adaptive Testing

Problem Durumu: Öùrenme-öùretme faaliyetleri beraberinde bu faaliyetlerin amacna ulaüp ulaümadùnn belirlenmesi ihtiyacn getirmektedir. Bu ihtiyaç ölçme ve deùerlendirme faaliyetleri ile giderilmektedir. Bu nedenle ölçme ve deùerlendirme eùitim-öùretim sürecinin ayrlmaz bir parças haline gelmiütir. Eùitimde ölçme ve deùerlendirme amacyla çeüitli yöntemler kullanlmaktadr. Bu yöntemlerden biri de çoktan seçmeli testlerdir. Bu testler özellikle geniü ölçekli snav uygulamalar için oldukça kullanüldr. Yüz yüze eùitimde olduùu gibi internet temelli eùitimde de tpk klasik eùitim yöntemlerinde olduùu gibi ölçmeye ihtiyaç duyulmaktadr. únternet teknolojisinin getirdiùi avantajlarla bilgisayar ortamnda çok sayda öùrencinin ayn anda snav olmas mümkündür. Ancak bu geleneksel ölçmedeùerlendirme üekli, bireysel öùrenme özelliklerinin ön plan çktù günümüz modern eùitim anlayüna ters düümektedir. Bu durum, geleneksel testlerin yeni eùitim anlayüna daha uygun olan uyarlanabilir testlere dönüümesini hzlandrmütr. Bu nedenle bireylerin bilgi seviyelerine göre sorularn zorluk düzeyini belirleyen Bilgisayarlaütrlmü Uyarlanabilir Test (BUT) sistemleri giderek yaygnlaümaktadr. BUT'larda testin zorluùu, katlmcnn bilgi seviyesine göre dinamik olarak deùiüir. Katlmc soruyu doùru yantlarsa sonraki soru daha zor bir olacak üekilde seçilir. Katlmc soruyu yanlü yantlarsa sonraki soru daha kolay bir soru olacak üekilde seçilir. Sorular seçilirken katlmcnn bilgi seviyesi hakknda en fazla bilgiyi saùlayan maddeler seçilir. Böylece uyarlanabilir testlerle geleneksel testlere göre daha verimli ve hassas ölçüm yaplmaktadr. BUT sistemleri Madde Tepki Kuram'n (MTK) temel alan uygulamalardr. Yurt dünda oldukça yaygn olan BUT sistemleri Türkiye'de henüz yaygnlaümamütr. Bu nedenle Türk eùitim sistemi içerisinde kullanlabilecek bir BUT sisteminin geliütirilmesi ve deùerlendirilmesi önem taümaktadr. Araütrmann Amac: Bu çalümann ana amac Türk eùitim sisteminin alt basamaklarnda kullanlabilecek (lise düzeyi) bir BUT sistemi geliütirmek ve güvenirlik düzeyi bakmndan deùerlendirmektir. Yöntem: Bu çalümada 11. snf matematik dersi olaslk ünitesinin alt konularna (permütasyon, kombinasyon, binom açlm ve olaslk) yönelik bir BUT sistemi geliütirilmiütir. BUT sisteminin geliütirilmesi, soru maddelerinin geliütirilmesi, uygulanmas ve MTK'ya göre analiz edilmesi gibi iülemlerden oluüan madde havuzu geliütirme aüamas, sistemin bilgisayar ortamnda kodlanmas ve uyarlanabilir zeki web tabanl matematik öùrenme ortam UZWEBMAT'a entegre edilmesi aüamalarndan oluümaktadr. Geliütirme aüamasndan sonra BUT sisteminin düüükten yükseùe bütün bilgi seviyelerinde ölçüm hassasiyeti deùerlendirilmiütir. Bunun için 2011-2012 öùretim yl güz döneminde Türkiye'de Trabzon ilindeki bir lisede snav uygulamas yaplmütr. Snav uygulamasna toplam 84 11. snf öùrencisi katlmütr. Snav uygulamasndan elde edilen veriler kullanlarak her bir öùrencinin aldù testlerin güvenirlik katsaylar hesaplanmütr. MTK temelli BUT'larn güvenirliùi, standart hata miktar ile ölçülmektedir. Standart hata oran düütükçe testin güvenirliùi artmaktadr. Standart hata miktar klasik güvenirlik katsaysna dönüütürülerek sunulmuütur. Veri toplama arac olarak sistem kaytlar kullanlmütr. Araütrmann Bulgular: Test sisteminin iüleyiüi, sistemin verilen yantlara göre her admda gerçek bilgi seviyesine nasl yaklaütùn ve bunu yaparken güvenirlik katsaysndaki deùiüimi somutlaütrmak için sunulmuütur. UZWEBMAT-CAT'in düüükten yükseùe bütün bilgi seviyelerinde nasl hareket ettiùini göstermek için bilgi seviyeleri farkl üç öùrencinin ünite sonu testi verileri kullanlmütr. Öùrenciler seçilirken yüksek, orta ve düüük bilgi seviyesi olarak nitelendirilebilecek öùrenciler olmasna dikkat edilmiütir. Farkl bilgi seviyesine sahip bu üç öùrencinin ilk sorudan son soruya doùru bilgi seviyesi kestirimlerindeki deùiüim miktar dikkat çekmektedir. Test ilerledikçe her bir öùrencinin kendi bilgi seviyesi kestirimleri arasndaki fark giderek azalmaktadr. Bunun anlam öùrencilerin kestirilmeye çalülan gerçek bilgi seviyelerine UZWEBMAT-CAT'in her admda biraz daha yaklaümasdr. Böylece gerçek bilgi seviyesinin kestirilmeye çalüldù aralk daralmaktadr. Testin sonunda elde edilen kestirim öùrencilerin her birinin gerçek bilgi seviyelerine çok çok yakn bir deùer olmaktadr. Bu durum testin standart hata ve buna baùl olarak hesaplanan güvenirlik katsays incelenerek anlaülabilir. Permütasyon, kombinasyon, binom açlm, olaslk ve ünite sonu testi olmak üzere toplam 5 ayr snav için öùrencilerin her birinin aldù testin güvenirlik katsaylar hesaplanmütr. Bunun için her bir testin standart hata miktar klasik güvenirlik katsaysna dönüütürülmüütür. Çalümann bulgular geliütirilen BUT sisteminin tüm konular için yüksek güvenirlikte testler ürettiùini göstermektedir. Her bir konuya iliükin testlerin ortalama güvenirlik katsaylar 0.93, 0.93, 0.88, 0.93 ve 0.91 olarak hesaplanmütr. Geliütirilen BUT sistemi düüükten yükseùe tüm bilgi seviyelerinde hassas ve güvenilir testler ürettiùi görülmüütür. Tartüma ve Sonuç: Literatürde BUT ile ilgili üzerinde durulan önemli özelliklerinden biri de her bir bireye kendi bilgi seviyesine uygun bir test sunduùu için düüükten yükseùe bütün bilgi sevilerinde çok hassas ölçüm yapma özelliùidir. Bu özelliùin geliütirilen BUT sistemi tarafndan saùlandù görülmüütür. Nitekim farkl bilgi seviyesine sahip öùrencilerin aldklar testlerin yüksek güvenirliùe sahip olduùu görülmüütür. Literatürde üzerinde durulan bir diùer durum da BUT'larn her bireye kendi bilgi seviyesinde sorular yönelttiùi için ölçümün standart hata miktarnn düütüùü ve dolaysyla ölçüm hassasiyetinin artmasdr. Geliütirilen BUT sisteminin de her bir öùrenciye kendi bilgi seviyesinde sorular yönelttiùi böylece ölçüm hassasiyetinin arttù görülmüütür. Yaplan testlerin güvenirlik katsaylarnn deùer aralklarna bakldùnda az sayda oldukça güvenilir ve çok sayda çok güvenilir aralklarna giren deùerler olduùu görülmektedir. UZWEBMAT-CAT'in deùerlendirilmesiyle ilgili bu çalüma

Öğrencilerin Olaslk Ünitesi Bilgi Seviyelerinin Bilgisayarlaştırılmış Uyarlanabilir Test ile Kestirilmesi

Problem Statement: Learning-teaching activities bring along the need to determine whether they achieve their goals. Thus, multiple choice tests addressing the same set of questions to all are frequently used. However, this traditional assessment and evaluation form contrasts with modern education, where individual learning characteristics are featured. Hence, the use of Computerized Adaptive Testing (CAT) systems, which set the difficulty level in accordance with the ability levels of individuals, is spreading. However, these systems are not prevalent in Turkey. Therefore, it is important to develop and assess a CAT system to be integrated into Turkish curriculum. Purpose of Study: The purpose of this study is to develop a CAT system that can be used in the sub-levels of Turkish curricula (high school) and assess it in terms of reliability. Methods: In this study, a CAT system aimed at the sub-topics (permutation, combination, binomial expansion, and probability) of the unit of probability covered in 11th grade mathematics was developed. Estimation sensitivity of the developed CAT system, from lower to higher ability levels, was assessed. To this end, an exam was implemented in a high school located in Trabzon in the 2011-2012 fall semester. Eighty-four 11th graders participated in the implementation. Using the data derived from the implementation, reliability coefficient values of each learner were calculated. System records were used for data collection. Results: Reliability coefficient values for each student in 5 different exams permutation, combination, binomial expansion, probability, and end-ofunit - were calculated. Findings of the study indicated that the developed CAT system produced tests with high reliability for all subjects. Average reliability coefficient values for each subject were found as 0.93, 0.93, 0.88, 0.93, and 0.91. Discussion and Conclusion: By addressing questions from lower to higher levels, which are appropriate to the ability level of each learner, CATs increase sensitivity and reliability of measurement. The developed CAT system addresses questions appropriate for the ability level of the learner, which increases sensitivity in measurement. In addition, it was observed that CAT systems developed for exams have the characteristic of making sensitive measurements ranging from lower to higher levels. This study, in relation to UZWEBMAT-CAT assessment, proved that CAT systems can safely be used within Turkish curriculum


