Serdar SAFALI, Burhan AKPUNAR, Ender ÖZEREN

ÖLÇME VE DEĞERLENDİRMEDE YENİ BİR ANLAYIŞ: BİLGİSAYAR ORTAMINDA BİREYSELLEŞTİRİLMİŞ TESTLER VE KISA CEVAPLI MADDELER

Bu çalışmanın amacı, ölçme ve değerlendirmede bireyselliğe verdiği önemle daha çok kullanılmaya başlanılan “bilgisayar ortamında bireyselleştirilmiş testler”in (BOB testlerin) ve Türkiye’de ÖSYM ve Anadolu Üniversitesinin sınavlarda sormaya başladığı “kısa cevaplı sorular”ın temellerini incelemek ve karşılaştırmaktır. Çalışmada literatür tarama yöntemi kullanılmış olup, veriler ilgili yerli ve yabancı literatürden elde edilmiştir. Öncelikle, programın en önemli unsurlarından bir tanesi olan “ölçme ve değerlendirme” değerlendirilmiş, günümüzde halen kullanılmakta olan kâğıt kalem testlerinin kullanımıyla birlikte getirmiş olduğu dezavantajlar irdelenmiş, teknolojinin gelişmesiyle birlikte ölçme ve değerlendirme sürecinde bireyselliğin öneminin artmasıyla birlikte, bilgisayar ve teknolojiyi de içeren geliştirilmiş alternatif ölçme araçlarından bahsedilerek, bilgisayar ve teknolojinin de kullanıldığı bilgisayar destekli alternatif testler ve bilgisayar ortamında bireyselleştirilmiş testlerde kısa cevaplı maddelerin kullanılabilirliği tartışılmıştır. Çalışma sonunda, gelişmiş teknolojinin ve buna bağlı olarak bilgisayarların eğitimin ölçme ve değerlendirme aşamasında kullanım amacı belirtilmiş, eğitimde ölçme ve değerlendirmede yeni arayışların sonucu olan, güvenirliği ve sınav uygulayıcısına sağladığı avantajlardan dolayı tercih edilebilen kısa cevaplı maddelerin önemi vurgulanmıştır. Yapılan çalışmayla oluşan alan yazındaki boşluğun doldurulması ve bilgisayar ortamında bireyselleştirilmiş testlerde kısa cevaplı sınav sistemiyle ilgili alan yazına katkı sağlanması hedeflenmiştir.

Anahtar Kelimeler:

Bilgisayar Ortamında Bireyselleştirilmiş Testler, Eğitimde Ölçme ve Değerlendirme, Kısa Cevaplı Maddeler, Madde Tepki Kuramı., Eğitim Programı

PDF

___

Akçadağ, T. (2010). Öğretmenlerin ilköğretim programındaki yöntem teknik ölçme ve değerlendirme konularına ilişkin eğitim ihtiyaçları. Türk Dünyası Sosyal Bilimler Dergisi, 53, 29-50.
Akpınar, B. (2015). Eğitimde program geliştirme. Ankara: Data Yayıncılık. Arslan, S. ve Özpınar, İ. (2008). Öğretmen nitelikleri: ilköğretim programının beklentileri ve eğitim fakültelerinin kazandırdıkları. Necatibey Eğitim Fakültesi Fen ve Matematik Eğitim Dergisi, 2(1), 38-63.
Berber,C. N.(2015).Türkiye ve Hong Kong fizik öğretimprogramlarının karşılaştırılması. Necati Bey Eğitim Fakültesi Elektronik Fen ve Matematik Dergisi, 9(2), 61-84.
Black, P. and Wiliam, D. (1998). Assessment and classroom learning. Assessment in Education, 5(1), 7–74.
Black, P., Harrison, C., Lee, C., Marshall, B. and William, D. (2003). Assessment for learning: Putting it into practice. New York, NY: Open University Press.
Boyd, A.M. (2003). Strategies for controlling testlet exposure rates in computerized adaptive testing systems. Unpublished doctoral dissertation. Texas University.
Chang,H.H.(2015).Psychometrics behind computerized adaptive testing.Psychometrika, 80, 120.
Crisp, V., and Ward, C. (2008). The development of a formative scenario-based computer assisted assessment tool in psychology for teachers: The PePCAA project. Computers & Education, 50(4), 1509–1526.
Daniel, L. G., and King, D. A. (1998). Knowledge and use of testing and measurement literacy of elementary and secondary teachers. The Journal of Educational Research, 91(6), 331-344.
DeMars, C. E. (2010). Type I error inflation for detecting DIF in the presence of impact. Educational and Psychological Measurement, 70, 961-972.
Demirel, Ö. (2012). Eğitimde program geliştirme. Ankara: PegemA Yayıncılık.
DeVellis, R. F. (2014). Scale development theory and applications. (T. Totan ve A. Ş. Avşar, Çev.) Ankara: Nobel Akademik Yayıncılık.
Embretson, S. E., and Reise, S. P. (2000). Item response theory for psychologists. Mahwah, NJ: Erlbaum.
Ertürk, S. (2013). Eğitimde program geliştirme. Ankara: Edge Akademi.
Frey, A., and Seitz, N. (2009). Multidimensional adaptive testing in educational and psychological measurement: Current state and future challenges, Studies in Educational Evaluation, 35, 89-94.
Gelen, İ. ve Beyazıt, N. (2007). Eski ve Yeni ilköğretim porgramları ile ilgili çeşitli görüşlerin karşılaştırılması, Educational Administration: Theory and Practice, 51, 457-476.
Georgiadou, E., Triantafillou, E., and Economides, A.A. (2006). Evaluation parameters for computer-adaptive testing. British Journal of Educational Technology, 37(2), 261-278.
GRE Türkiye Resmi Web Sitesi (2017). https://www.ets.org/gre adresinden 12.06.2017 tarihinde alınmıştır.
Gredler, M. E. (1999). Classroom assessment and learning. Newyork: Longman.
Gusev, M., and Armenski, G. (2014). E-assessment systems and online learning with adaptive testing. In (M. Ivanovic, and L. C. Jain (Eds.), E-Learning Paradigms And Applications. Heidelberg: Springer.
Gül, E. (2011). İlköğretim öğretmen adaylarının ölçme-değerlendirme okuryazarlığı ve ölçme-değerlendirmeye ilişkin tutumlarının belirlenmesi, Yayınlanmış Yüksek Lisans Tezi. Fırat Üniversitesi, Fen Bilimleri Enstitüsü.
Huang, Y., Lin, Y., and Cheng, S. (2009). An adaptive testing system for supporting versatile educational assessment. Computers and Education, 52, 53-67.
Hunkins, P.C., and Ornstein C.A. (2014). Eğitim programı, temeller, ilkeler ve sorunlar. (A. Arı, Çev.). Konya: Eğitim Yayınevi.
Kandemir, A. (2016). İlkokul 2. sınıf ingilizce öğretim programının katılımcı odaklı program değerlendirme yaklaşımıyla değerlendirilmesi, Yayınlanmış Yüksek Lisans Tezi. Pamukkale Üniversitesi, Eğitim Bilimleri Enstitüsü
Karakaya, Ş. (2004). Eğitimde program geliştirme çalışmaları ve yeni yönelimler.Ankara: Asil Yayın Dağıtım.
Kelly, D.L. (2002). The TIMSS 1995 international benchmarks of mathematics and science achievement: profiles of world class performance at fourth and eighth grades. Educational Research and Evaluation, 8 (1), 41-54.
Koç, E. S. (2015). Oyun ve fiziki etkinlikler dersi öğretim programının karşılaştırmalı olarak incelenmesi (kanada örneği). Kastamonu Eğitim Dergisi, 21(1), 263- 280.
Lin, H. (2012). Item selection methods in multidimensional computerized adaptive testingadopting polytomously-scored items under multidımensional generalized partial creditmodel. Unpublisjed Doctoral Dissertation. University of Illinois at Urbana-Champaig.
Marsh, C. J. (2004). Key concepts for understanding curriculum (3rd Edition). Taylor & Francis e-Library.
Mayrath, M. C., Clarke-Midura, J., and Robinson, D. H. (2012). Technology-based assessments for 21st century skills: Theoretical and practical implications from modern research. Charlotte, NC: Information Age Publishing.
McBride, J.R., and Martin, J.T. (1983). Reliability and validity of adaptive ability tests in a military setting. in Weiss D.J. (Ed.) New Horizons in Testing. New York: Academic Press.
Nitko, A. J., and Brookhart, S. M. (2016). Öğrencilerin eğitsel değerlendirmesi. (B. Bıçak, M. Bahar ve S. Özel, Çev.). Ankara: Nobel Akademik Yayıncılık.
Ornstein, A. C., and Hunkins, F. P. (2009). Curriculum: foundations, principles, and issues (5th Edition), Boston: Allyn & Bacon.
ÖSYM Resmi Web Sitesi. (2017). http://www.osym.gov.tr/TR,12909/2017-lisans- yerlestirme-sinavlari-2017-lys-acik-uclu-sorular-hakkinda-bilgilendirme-ve- acik-uclu-soru-ornekleri-05012017.html 12.06.2017 tarihinde alınmıştır.
Özçelik, D. A. (2010). Eğitim programları ve öğretim. Ankara: Pegem Akademi.
Özdemir, B. (2015). Madde düzeyinde boyutluluk modellerinin bilgisayar ortamında bireyselleştirilmiş test yöntemleri üzerindeki etkisinin incelenmesi. Yayınlanmış Doktora Tezi. Hacettepe Üniversitesi, Eğitim Bilimleri Anabilim Dalı.
Pendergast, D., Garvis, S., and Keogh, J. (2011). Pre-service student-teacher self-efficacy beliefs: An insight into the making of teachers, Australian Journal of Teacher Education, 36(12), 46–58.
Physical Education Curriculum Guide: Primary/Elementary. (2011). http://www.ed.gov. nl.ca/edu/k12/curriculum/guides/physed/index.html#primary/ adresinden 21.05.2017 tarihinde alınmıştır.
PISA Türkiye Resmi Web Sitesi. (2017). http://pisa.meb.gov.tr/?page_id=18 adresinden 25.05.2017 tarihinde alınmıştır.
Posner, G. J. (1995). Analyzing the curriculum. New York: McGraw Hill. Practical Assessment, Research & Evaluation, 16(1). Available online: http://pareonline. net/getvn.asp?v=16&n=1.
Preston, R., and Aikman, S. (2005). Setting the scene: measurement and learning beyond the mainstream. International Journal of Educational Development, 25, 99- 110.
Sabancı, O. ve Yazıcı, K. (2017). Öğretmen adayların ölçme ve değerlendirmeye yönelik yeterlik algılarının incelenmesi. Trakya Üniversitesi, Eğitim Fakültesi Dergisi, 7(7), 128-153.
Semerci, Ç. (2008). Ölçme ve değerlendirme. Ankara: Pegem Akademi.
Seng, T. O., Parsons, R. D., Hinson, S. L., and Sardo-Brown, D. (2003). Educational psychology: A practitioner–researcher approach. Thomson Learning, 250–251.
Sönmez, V. (2012). Program geliştirmede öğretmen el kitabı (17. Baskı). Ankara: Anı Yayıncılık.
Tekin, H. (2010). Eğitimde ölçme ve değerlendirme. Ankara: Yargı Yayınevi. The American Educational Research Association, The American Psychological
Association, The National Council on Measurement in Education. (1997). Eğitimde ve psikolojide ölçme standartları. (S. Hovardaoğlu ve N. Sezgin, Çev.) Ankara: Türk Psikologlar Derneği.
Thompson, Nathan A., and Weiss, David A. (2011). A framework for the development of computerized adaptive tests.
Thorndike, R. M., and Thorndike-Christ, T. (2010). Measurement and evaluation in psychology and education. Pearson.
TIMMS 2015, Türkiye. (2017). http://timss.meb.gov.tr adresinden 25.05.2017 tarihinde alınmıştır.
Tian, J., Miao D., Zhu X., and Gong, J. (2007). An ıntroduction to the computerized adaptive testing. US-China Education Review, 4(1), 72-81.
TOEFL Resmi Web Sitesi. (2017). https://www.ets.org/toefl adresinden 12.06.2017 tarihinde alınmıştır. Tschannen-Moran, M. And Hoy, A. W. (2001). Teacher efficacy: Capturing an elusive construct, Teaching and Teacher Education, 17(7), 783–805. T uncer, M. ve Özeren, E. (2015). Alternatif ölçme ve değerlendirme araçları üzerine bir meta analiz çalışması. Eğitim ve Öğretim Araştırmaları Dergisi, 4(2), 374-386.
Turgut, M. F. ve Baykul, Y. (2010). Eğitimde ölçme ve değerlendirme. Ankara: Pegem Akademi. Uşun, S. (2012). Eğitimde program değerlendirme süreçler yaklaşımlar ve modeller. Ankara: Anı Yayıncılık.
Wainer, H.(1993). Some practical considerations when converting a linearly administrated test to an adaptive format. Educational Measurement: Issues and Practices, 12, 15-20.
Wang, T. H. (2007). Whatstrategies are effective for formative assessment in an e-learning environment? Journal of Computer Assisted Learning, 23(3), 171–186.
Weiss,J. D. (2004). Computerized adaptive testing for effective and efficient measurement in counseling and education. Measurement and Evaluation in Counseling and Development, 37(2),70-84.
Wesman, A. G. (1971). Educational measurement. Writing the test item. Wahington DC: American Council on Education.
Wu, H. K., Kuo, C. Y., Jen, T. H., and Hsu, Y. S. (2015). What makes an item more difficult? effects of modality and type of visual information in a computer-based assessment of scientific inquiry abilities. Computers & Education, 85, 35-48.
Yavuz, İ. ve Bilgeç, İ. (2016). Açık uçlu sorularla yapılan matematik sınavlarının ölçme ve değerlendirilmesinin incelenmesi. Eğitim ve Öğretim Araştırmaları Dergisi, 5(3), 183-193.
Ültanır, G. (2016). Program değerlendirme. Ankara: Nobel Yayınevi.