ÖLÇME VE DEĞERLENDİRMEDE YENİ BİR ANLAYIŞ: BİLGİSAYAR ORTAMINDA BİREYSELLEŞTİRİLMİŞ TESTLER VE KISA CEVAPLI MADDELER
Bu çalışmanın amacı, ölçme ve değerlendirmede bireyselliğe verdiği önemle daha çok kullanılmaya başlanılan “bilgisayar ortamında bireyselleştirilmiş testler”in (BOB testlerin) ve Türkiye’de ÖSYM ve Anadolu Üniversitesinin sınavlarda sormaya başladığı “kısa cevaplı sorular”ın temellerini incelemek ve karşılaştırmaktır. Çalışmada literatür
tarama yöntemi kullanılmış olup, veriler ilgili yerli ve yabancı literatürden elde edilmiştir. Öncelikle, programın en önemli unsurlarından bir tanesi olan “ölçme ve değerlendirme” değerlendirilmiş, günümüzde halen kullanılmakta olan kâğıt kalem testlerinin kullanımıyla birlikte getirmiş olduğu dezavantajlar irdelenmiş, teknolojinin gelişmesiyle
birlikte ölçme ve değerlendirme sürecinde bireyselliğin öneminin artmasıyla birlikte, bilgisayar ve teknolojiyi de içeren geliştirilmiş alternatif ölçme araçlarından bahsedilerek,
bilgisayar ve teknolojinin de kullanıldığı bilgisayar destekli alternatif testler ve bilgisayar ortamında bireyselleştirilmiş testlerde kısa cevaplı maddelerin kullanılabilirliği tartışılmıştır. Çalışma sonunda, gelişmiş teknolojinin ve buna bağlı olarak bilgisayarların eğitimin ölçme ve değerlendirme aşamasında kullanım amacı belirtilmiş, eğitimde ölçme
ve değerlendirmede yeni arayışların sonucu olan, güvenirliği ve sınav uygulayıcısına sağladığı avantajlardan dolayı tercih edilebilen kısa cevaplı maddelerin önemi vurgulanmıştır. Yapılan çalışmayla oluşan alan yazındaki boşluğun doldurulması ve bilgisayar ortamında bireyselleştirilmiş testlerde kısa cevaplı sınav sistemiyle ilgili alan yazına katkı sağlanması hedeflenmiştir.
___
- Akçadağ, T. (2010). Öğretmenlerin ilköğretim programındaki yöntem teknik ölçme ve
değerlendirme konularına ilişkin eğitim ihtiyaçları. Türk Dünyası Sosyal Bilimler
Dergisi, 53, 29-50.
- Akpınar, B. (2015). Eğitimde program geliştirme. Ankara: Data Yayıncılık.
Arslan, S. ve Özpınar, İ. (2008). Öğretmen nitelikleri: ilköğretim programının beklentileri
ve eğitim fakültelerinin kazandırdıkları. Necatibey Eğitim Fakültesi Fen ve
Matematik Eğitim Dergisi, 2(1), 38-63.
- Berber,C. N.(2015).Türkiye ve Hong Kong fizik öğretimprogramlarının karşılaştırılması.
Necati Bey Eğitim Fakültesi Elektronik Fen ve Matematik Dergisi, 9(2), 61-84.
- Black, P. and Wiliam, D. (1998). Assessment and classroom learning. Assessment in
Education, 5(1), 7–74.
- Black, P., Harrison, C., Lee, C., Marshall, B. and William, D. (2003). Assessment for
learning: Putting it into practice. New York, NY: Open University Press.
- Boyd, A.M. (2003). Strategies for controlling testlet exposure rates in computerized
adaptive testing systems. Unpublished doctoral dissertation. Texas University.
- Chang,H.H.(2015).Psychometrics behind computerized adaptive testing.Psychometrika,
80, 120.
- Crisp, V., and Ward, C. (2008). The development of a formative scenario-based computer
assisted assessment tool in psychology for teachers: The PePCAA project.
Computers & Education, 50(4), 1509–1526.
- Daniel, L. G., and King, D. A. (1998). Knowledge and use of testing and measurement
literacy of elementary and secondary teachers. The Journal of Educational
Research, 91(6), 331-344.
- DeMars, C. E. (2010). Type I error inflation for detecting DIF in the presence of impact.
Educational and Psychological Measurement, 70, 961-972.
- Demirel, Ö. (2012). Eğitimde program geliştirme. Ankara: PegemA Yayıncılık.
- DeVellis, R. F. (2014). Scale development theory and applications. (T. Totan ve A. Ş.
Avşar, Çev.) Ankara: Nobel Akademik Yayıncılık.
- Embretson, S. E., and Reise, S. P. (2000). Item response theory for psychologists.
Mahwah, NJ: Erlbaum.
- Ertürk, S. (2013). Eğitimde program geliştirme. Ankara: Edge Akademi.
- Frey, A., and Seitz, N. (2009). Multidimensional adaptive testing in educational and
psychological measurement: Current state and future challenges, Studies in
Educational Evaluation, 35, 89-94.
- Gelen, İ. ve Beyazıt, N. (2007). Eski ve Yeni ilköğretim porgramları ile ilgili çeşitli
görüşlerin karşılaştırılması, Educational Administration: Theory and Practice,
51, 457-476.
- Georgiadou, E., Triantafillou, E., and Economides, A.A. (2006). Evaluation parameters
for computer-adaptive testing. British Journal of Educational Technology, 37(2),
261-278.
- GRE Türkiye Resmi Web Sitesi (2017). https://www.ets.org/gre adresinden 12.06.2017
tarihinde alınmıştır.
- Gredler, M. E. (1999). Classroom assessment and learning. Newyork: Longman.
- Gusev, M., and Armenski, G. (2014). E-assessment systems and online learning with
adaptive testing. In (M. Ivanovic, and L. C. Jain (Eds.), E-Learning Paradigms
And Applications. Heidelberg: Springer.
- Gül, E. (2011). İlköğretim öğretmen adaylarının ölçme-değerlendirme okuryazarlığı ve
ölçme-değerlendirmeye ilişkin tutumlarının belirlenmesi, Yayınlanmış Yüksek
Lisans Tezi. Fırat Üniversitesi, Fen Bilimleri Enstitüsü.
- Huang, Y., Lin, Y., and Cheng, S. (2009). An adaptive testing system for supporting
versatile educational assessment. Computers and Education, 52, 53-67.
- Hunkins, P.C., and Ornstein C.A. (2014). Eğitim programı, temeller, ilkeler ve sorunlar.
(A. Arı, Çev.). Konya: Eğitim Yayınevi.
- Kandemir, A. (2016). İlkokul 2. sınıf ingilizce öğretim programının katılımcı odaklı
program değerlendirme yaklaşımıyla değerlendirilmesi, Yayınlanmış Yüksek
Lisans Tezi. Pamukkale Üniversitesi, Eğitim Bilimleri Enstitüsü
- Karakaya, Ş. (2004). Eğitimde program geliştirme çalışmaları ve yeni yönelimler.Ankara:
Asil Yayın Dağıtım.
- Kelly, D.L. (2002). The TIMSS 1995 international benchmarks of mathematics and
science achievement: profiles of world class performance at fourth and eighth
grades. Educational Research and Evaluation, 8 (1), 41-54.
- Koç, E. S. (2015). Oyun ve fiziki etkinlikler dersi öğretim programının karşılaştırmalı
olarak incelenmesi (kanada örneği). Kastamonu Eğitim Dergisi, 21(1), 263-
280.
- Lin, H. (2012). Item selection methods in multidimensional computerized adaptive
testingadopting polytomously-scored items under multidımensional generalized
partial creditmodel. Unpublisjed Doctoral Dissertation. University of Illinois at
Urbana-Champaig.
- Marsh, C. J. (2004). Key concepts for understanding curriculum (3rd Edition). Taylor &
Francis e-Library.
- Mayrath, M. C., Clarke-Midura, J., and Robinson, D. H. (2012). Technology-based
assessments for 21st century skills: Theoretical and practical implications from
modern research. Charlotte, NC: Information Age Publishing.
- McBride, J.R., and Martin, J.T. (1983). Reliability and validity of adaptive ability tests
in a military setting. in Weiss D.J. (Ed.) New Horizons in Testing. New York:
Academic Press.
- Nitko, A. J., and Brookhart, S. M. (2016). Öğrencilerin eğitsel değerlendirmesi. (B.
Bıçak, M. Bahar ve S. Özel, Çev.). Ankara: Nobel Akademik Yayıncılık.
- Ornstein, A. C., and Hunkins, F. P. (2009). Curriculum: foundations, principles, and
issues (5th Edition), Boston: Allyn & Bacon.
- ÖSYM Resmi Web Sitesi. (2017). http://www.osym.gov.tr/TR,12909/2017-lisans-
yerlestirme-sinavlari-2017-lys-acik-uclu-sorular-hakkinda-bilgilendirme-ve-
acik-uclu-soru-ornekleri-05012017.html 12.06.2017 tarihinde alınmıştır.
- Özçelik, D. A. (2010). Eğitim programları ve öğretim. Ankara: Pegem Akademi.
- Özdemir, B. (2015). Madde düzeyinde boyutluluk modellerinin bilgisayar ortamında
bireyselleştirilmiş test yöntemleri üzerindeki etkisinin incelenmesi. Yayınlanmış
Doktora Tezi. Hacettepe Üniversitesi, Eğitim Bilimleri Anabilim Dalı.
- Pendergast, D., Garvis, S., and Keogh, J. (2011). Pre-service student-teacher self-efficacy
beliefs: An insight into the making of teachers, Australian Journal of Teacher
Education, 36(12), 46–58.
- Physical Education Curriculum Guide: Primary/Elementary. (2011). http://www.ed.gov.
nl.ca/edu/k12/curriculum/guides/physed/index.html#primary/ adresinden
21.05.2017 tarihinde alınmıştır.
- PISA Türkiye Resmi Web Sitesi. (2017). http://pisa.meb.gov.tr/?page_id=18 adresinden
25.05.2017 tarihinde alınmıştır.
- Posner, G. J. (1995). Analyzing the curriculum. New York: McGraw Hill.
Practical Assessment, Research & Evaluation, 16(1). Available online: http://pareonline.
net/getvn.asp?v=16&n=1.
- Preston, R., and Aikman, S. (2005). Setting the scene: measurement and learning beyond
the mainstream. International Journal of Educational Development, 25, 99-
110.
- Sabancı, O. ve Yazıcı, K. (2017). Öğretmen adayların ölçme ve değerlendirmeye yönelik
yeterlik algılarının incelenmesi. Trakya Üniversitesi, Eğitim Fakültesi Dergisi,
7(7), 128-153.
- Semerci, Ç. (2008). Ölçme ve değerlendirme. Ankara: Pegem Akademi.
- Seng, T. O., Parsons, R. D., Hinson, S. L., and Sardo-Brown, D. (2003). Educational
psychology: A practitioner–researcher approach. Thomson Learning, 250–251.
- Sönmez, V. (2012). Program geliştirmede öğretmen el kitabı (17. Baskı). Ankara: Anı
Yayıncılık.
- Tekin, H. (2010). Eğitimde ölçme ve değerlendirme. Ankara: Yargı Yayınevi.
The American Educational Research Association, The American Psychological
- Association, The National Council on Measurement in Education. (1997).
Eğitimde ve psikolojide ölçme standartları. (S. Hovardaoğlu ve N. Sezgin, Çev.)
Ankara: Türk Psikologlar Derneği.
- Thompson, Nathan A., and Weiss, David A. (2011). A framework for the development of
computerized adaptive tests.
- Thorndike, R. M., and Thorndike-Christ, T. (2010). Measurement and evaluation in
psychology and education. Pearson.
- TIMMS 2015, Türkiye. (2017). http://timss.meb.gov.tr adresinden 25.05.2017 tarihinde
alınmıştır.
- Tian, J., Miao D., Zhu X., and Gong, J. (2007). An ıntroduction to the computerized
adaptive testing. US-China Education Review, 4(1), 72-81.
- TOEFL Resmi Web Sitesi. (2017). https://www.ets.org/toefl adresinden 12.06.2017
tarihinde alınmıştır.
Tschannen-Moran, M. And Hoy, A. W. (2001). Teacher efficacy: Capturing an elusive
construct, Teaching and Teacher Education, 17(7), 783–805.
T
uncer, M. ve Özeren, E. (2015). Alternatif ölçme ve değerlendirme araçları üzerine bir
meta analiz çalışması. Eğitim ve Öğretim Araştırmaları Dergisi, 4(2), 374-386.
- Turgut, M. F. ve Baykul, Y. (2010). Eğitimde ölçme ve değerlendirme. Ankara: Pegem
Akademi.
Uşun, S. (2012). Eğitimde program değerlendirme süreçler yaklaşımlar ve modeller.
Ankara: Anı Yayıncılık.
- Wainer, H.(1993). Some practical considerations when converting a linearly administrated
test to an adaptive format. Educational Measurement: Issues and Practices, 12,
15-20.
- Wang, T. H. (2007). Whatstrategies are effective for formative assessment in an e-learning
environment? Journal of Computer Assisted Learning, 23(3), 171–186.
- Weiss,J. D. (2004). Computerized adaptive testing for effective and efficient measurement
in counseling and education. Measurement and Evaluation in Counseling and
Development, 37(2),70-84.
- Wesman, A. G. (1971). Educational measurement. Writing the test item. Wahington DC:
American Council on Education.
- Wu, H. K., Kuo, C. Y., Jen, T. H., and Hsu, Y. S. (2015). What makes an item more
difficult? effects of modality and type of visual information in a computer-based
assessment of scientific inquiry abilities. Computers & Education, 85, 35-48.
- Yavuz, İ. ve Bilgeç, İ. (2016). Açık uçlu sorularla yapılan matematik sınavlarının ölçme
ve değerlendirilmesinin incelenmesi. Eğitim ve Öğretim Araştırmaları Dergisi,
5(3), 183-193.
- Ültanır, G. (2016). Program değerlendirme. Ankara: Nobel Yayınevi.