PAÜ Tıp Fakültesi dönem I öğrencilerine 2006-2007 eğitim ve öğretim yılında uygulanan çoktan seçmeli sınavların madde ve test analizleri

Çoktan Seçmeli Sınavlar bilişsel düzeydeki öğrenme hedeflerini değerlendirmek amacıyla sıkça kullanılır. 2006-2007 Eğitim ve Öğretim yılında Dönem I öğrencilerine uygulanan Çoktan Seçmeli Sınavların Madde ve Test Analizleri yapılmıştır. Sonuçların öğretim üyeleri ile paylaşılarak daha kaliteli test maddelerinin hazırlanması ve bir soru bankasının yapılandırılması amaçlanmıştır. Bir yılda uygulanan toplam 23 Çoktan Seçmeli Sınav ve 1368 madde incelenmiştir. Maddelerin Zorluk ve Ayırıcılık İndeksleri Kelley tarafından önerilen sistemle hesaplanmıştır. Her bir testin Güçlük, Çarpıklık değerleri hesaplanmış ve Kuder-Richardson katsayısı bulunmuştur. Zorluk İndeksi açısından önerilen ve kabul edilebilir sınırın içinde 700 adet madde (%51.1) bulunmuştur. Ayırıcılık İndeksine göre ise 699 madde çok iyi (%51.0) ve 284 madde iyi (%20.7) olarak saptanmıştır. Zorluk ve Ayırıcılık İndekslerine göre toplam 651 madde (%47.5) kaliteli olarak belirlenmiştir. Testlerin Güçlük değerinin ortalaması (0.644) 0.5’e yakın bulunmuştur. Çarpıklık değeri bütün testler için negatiftir. Testler genel olarak güvenilirlik açısından değerlendirildiğinde Dizi genişliği/Standart sapma oranı 19 test için 4-6 arasında, testlerin tamamında Kuder-Richardson 21 indeksinin 0.5’in altında olduğu görülmüştür. Testlerin bir bütün olarak analizi güvenilirliğin iyi olduğunu göstermiştir. Ancak KR-21 indeksinin düşük olması (

Item and test analysis of multıple-choıce exams which applied to the first term students of Pamukkale Unıversıty Medıcal Faculty in 2006-2007 academic year

The Multiple Choice Questions are often used to evaluate the educational objectives for cognitive learning. Item and test analysis of the Multiple Choice Tests which applied to first term students was performed in 2006-2007 academic year. Sharing the results with academicians to prepare better quality test items and construct a test question bank was aimed. A total of 23 Multiple Choice Tests and 1368 items which were applied in one year were analysed. The difficulty and discrimination index of items were measured with the system proposed by Kelley. The facility and discrimination index and Kuder-Richardson coefficient were calculated for each test. There were 700 items (51.1%) in the suggested and acceptable level according to difficulty index of the questions. Analyzing the discrimination index revealed that 699 items (51.0%) were very good and 284 (20.7%) items were good. Total 651 items (47.5%) were determined of good quality according to difficulty and discrimination index. The average facility index (0.644) of tests was found near 0.5. The discrimination indexes of all tests were negative. When the reliability of tests was appraised, it was seen that the Range/Standard deviation ratio was between 4 and 6 for 19 tests and Kuder-Richardson 21 index is under 0.5 for all tests. The entire analyses of tests showed that the reliability was good. However the low index of Kuder- Richardson 21 indicates the poor inner consistency of the tests. Sharing the results with academicians for preparing better quality Multiple Choice Questions and to continuing the studies for constructing of a test question bank is concluded.


  • 1. Collins J, Education Techniques For Lifelong Learning : Writing Multiple-Choice Questions For Continuing Medical Education Activities and Self-Assessment Modules, RadioGraphics 2006; 26: 543-51.
  • 2. Kehoe J, Basic Item Analysis for Multiple-Choice Tests, Practical Assessment, Research & Evaluation 1995. Erişim:, Erişim Tarihi: 10.02.2008
  • 3. Tekin H. Eğitimde Ölçme Ve Değerlendirme, Yargı Yayınevi: 17. Baskı, Ankara; 2004.
  • 4. Atılgan H, Kan A, Doğan N. Eğitimde Ölçme Ve Değerlendirme, Anı Yayıncılık: Ankara; 2006.
  • 5. Eskiocak S, Süer Gökmen S, Erbaş H, Çakır E, Gülen Ş. Trakya Üniversitesi Tıp Fakültesinde Son 5 Yılda Yapılan Biyokimya Sınav Sorularının Analizi. Türk Biyokimya Dergisi 2004; 29: 273-6.
  • 6. Sarin YK, Khurana M, Natu MV, Thomas AG, Singh T. Item Analysis of Published MCQ’s. Indian Pediatrics 1998; 35:1103-5
  • 7. Bekiroğlu FO. Ne Kadar Başarılı? Klasik Ve Alternatif Ölçme Değerlendirme Yöntemleri: Fizikte Uygulamalar. Nobel Kitabevi: 1. Basım, Ankara; 2004.
  • 8. Kim Seock-Ho. A Computer Program for Classical Item Analysis. The University of Georgia; 1999.
  • Erişim:, Erişim Tarihi: 10.02.2008
  • 9. Ebel Robert L. The Relation of Item Discrimination to Test Reliability. Journal of Educational Measurement 1967; 4: 125-8.
  • 10. Kelley T L. The selection of upper and lower groups for the validation of test items. The Journal of Educational Psychology 1939; 30: 17-24.
  • 11. Kocabaşoğlu YE. Çoktan Seçmeli Soru Analizi ve Çoktan Seçmeli Soru Sınavları, Akdeniz Ü. Tıp Fak. Ölçme Değerlendirme Kursu: Antalya; 2002. Erişim: ame.htm,Erişim Tarihi: 10.02. 2008.
  • 12. Kocabaşoğlu YE. Tıp Eğitiminde Ölçme Değerlendirme Teknikleri (Ön Okuma), Akdeniz Ü. Tıp Fak. Ölçme Değerlendirme Kursu: Antalya; 2002. Erişim: c. Erişim Tarihi: 10.02.2008
  • 13. Arıcı H. İstatistik, Yöntemler ve Uygulamalar. Meteksan Basımevi: Ankara; 1991.
  • 14. Ercan İ, Kan İ. Ölçeklerde Güvenirlik ve Geçerlik. Uludağ Üniversitesi Tıp Fakültesi Dergisi 2004; 30: 211-6.
  • 15. Özen Y, Gülaçtı F, Kandemir M. Eğitim Bilimleri Araştırmalarında Geçerlik Ve Güvenirlik Sorunsalı. Erzincan Eğitim Fakültesi Dergisi 2006; 8: 69-89.
  • 16. Durak Hİ. Ölçme-Değerlendirmede (Sınama) Yararlı Yenilikler. UTEK 2004 Ulusal Tıp Eğitimi Kongresi Kitabı: Şanlıurfa; 2004. s. 23-6.
  • 17. Turhan K, Yarış F. Özen İ, Dikici MF. Karadeniz Teknik Üniversitesi Tıp Fakültesi Soru Bankası Projesi ve Dinamik Web Modülü. UTEK 2004 Ulusal Tıp Eğitimi Kongresi Kitabı: Şanlıurfa; 2004. s.162.
  • 18. Crisp GT, Palmer EJ. Engaging Academics with a Simplified Analysis of their Multiple-Choice Question (MCQ) Assessment Results. Journal of University Teaching and Learning Practice 2007; 4: 88-102.