Öğrenci Proje Anketlerini Sınıflandırmada En İyi Algoritmanın Belirlenmesi

Pek çok alanda etkili bir şekilde kullanılan veri madenciliğinin, günümüzde eğitim alanındaki uygulamaları hızla artmaktadır. Veri madenciliği yöntemleri ile eldeki veriler sınıflandırılarak, gruplandırılarak ya da veriler arasında ilişkiler, bağıntılar, istatistiksel sonuçlar oluşturularak modeller oluşturulur. Oluşturulan model, oluşturulduğu veri kümesinde olmayan yeni bir kayıt geldiğinde, yeni gelen kayıt hakkında tahminleme yapar. Yapılan tahminlerin doğruluk derecesi oluşturulmuş modelin veri üzerindeki başarısını ortaya koyar. Bu çalışmada Yıldız Teknik Üniversitesi, Bilgisayar Mühendisliği bölümü, Sistem Analizi ve Tasarımı ile Yazılım Mühendisliği dersinde gerçekleştirilen projeler ile ilgili öğrencilere yapılan anketlerden veri seti oluşturulmuştur. Elde edilen bu veri setine sınıflandırma algoritmaları uygulanarak en başarılı algoritma tespit edilmiştir. Çalışmadaki amaç proje tabanlı gerçekleştirilen derslerde, proje başarısını arttırmak için öğrenci projelerinin sınıflandırılmasında en iyi sınıflandırma algoritmasının tespit edilmesidir. En başarılı algoritma tespit edilirken doğruluk, MAE, RMSE ve KAPPA değerleri göz önüne alınmıştır. Sonuç olarak öğrenci projelerinden elde edilen veri setini sınıflandırmada en iyi algoritmanın J48(C4.5) olduğu tespit edilmiştir.

Determining The Most Successful Classification Algorithm For The Student Project Questionnaire

Data mining is used in many areas including knowledge discovery tasks in machine learning, statistics, and database systems. At present particularly in educational area, use of data mining and its applications is increasing. Data mining methods are used to create models from the data by classification, clustering or simply applying correlation rules in the data. When the new instance/record, which is not available in the current data set, appears, this model can be used to make assumptions regarding to that instance. Precision level of those estimates shows the accuracy of the created model on the data set. In this study, the data set is created by using questionnaires, which were collected from System Analysis and Design courses at Computer Engineering Department, Yıldız Technical University(YTU). Those questionnaire consist of student answers that are related to the projects, which are developed in these courses. Classification algorithms are applied on this data set to decide the most successful algorithm for classification. The main goal of this study is to reveal the most successful classification algorithm in terms of student projects classification tasks for purpose of increasing the success rate of the projects in the courses that are based on the projects. Accuracy, Mean Absolute Error(MAE), Root Mean Square Error(RMSE), and KAPPA metrics are used to evaluate performance of those algorithms. The experimental result of this study shows that Multilayer Perceptron(MLP) algorithm performs better that other algorithms on this data set. Also Appriori algorithm used for finding some rules.

___

  • Saiedian, H., Bagert, D., Mead, N. Software Engineering Programs: Dispelling the Myths and Misconceptions, IEEE Software, 2002, pp. 35-46.
  • Hilburn, T., Humphrey, W.The Impending Changes in Software Education, IEEE Software, 2002, pp. 22-24.
  • Kurt, Ç., Erdem, O.A.. Öğrenci Başarısını Etkileyen Faktörlerin Veri Madenciliği Yöntemleriyle İncelenmesi, Politeknik Dergisi, 2012, pp. 111-116.
  • Bırtıl, F. S. Kız meslek lisesi öğrencilerinin akademik başarısızlık nedenlerinin veri madenciliği tekniği ile analizi, Yüksek Lisans Tezi, Afyon Kocatepe Üniversitesi, Fen Bilimleri Enstitüsü, 2011.
  • Bozkır, A.S., Sezer, E., Gök, B. Öğrenci Seçme Sınavında (ÖSS) Öğrenci Başarımını Etkileyen Faktörlerin Veri Madenciliği Yöntemleriyle Tespiti, 5. Uluslararası İleri Teknolojiler Sempozyumu (IATS’09), Karabük Üniversitesi, 2009, pp. 37-43.
  • Aydın, S. Veri madenciliği ve Anadolu üniversitesi uzaktan eğitim sisteminde bir uygulama, Doktora Tezi, Anadolu Üniversitesi, Sosyal Bilimler Enstitüsü, 2007.
  • Ayık, Y.Z., Özdemir, A., Yavuz, U. Lise Türü ve Lise Mezuniyet Başarısının Kazanılan Fakülte ile İlişkisinin Veri Madenciliği Tekniği ile Analizi, Sosyal Bilimler Enstitüsü Dergisi, 10(2), 2007.
  • Karabatak, M., İnce, M. C. Apriori Algoritması ile Öğrenci Başarısı Analizi, Eleco’ 2004 ElektrikElektronik ve Bilgisayar Mühendisleri Sempozyumu, Bursa, 2004.
  • Aha, D., Kibler, D. Instance-based learning algorithms, Machine Learning, 1991, pp. 37-66.
  • Cleary, J.G., Trigg, L.E. K*: An Instance-based Learner Using an Entropic Distance Measure, Proceedings Tweleveth International Conference on Machine Learning, Tahoe City, California, 1995, pp. 108-114.
  • Internet: Bayes Ağları (Bayes Network), http://bilgisayarkavramlari.sadievrenseker.com/ 2008/12/21/bayes-aglari-bayesian-network/, Ekim 2015.
  • Tan, P.N., Steinbach, M., Kumar, V. Introduction to Data Mining, USA, 2006.
  • Internet: Data Mining Software in Java, www.cs.waikato.ac.nz/~ml/weka/, Mart 2013.
  • Ardıl, E., Esnek Hesaplama Yaklaşımı İle Yazılım Hata Kestirimi, Yüksek Lisans Tezi, Trakya Üniversitesi, Fen Bilimleri Enstitüsü, 2009.
  • Weı, C., Chıu, T., Turning telecommunications call details to churn prediction : a data mining approach, Expert Systems with Applications, 2002, pp. 103-102.
  • Quinlan, J.R., Induction of Decision Trees, Machine Learning, 1986, pp. 81-106.
  • Silahtaroğlu, G., Kavram ve Algoritmalarıyla Temel Veri Madenciliği, Papatya Yayıncılık, İstanbul, Türkiye, 2008.
  • Kıyan, T., Yıldırım, T., Eğiticili Ve Eğiticisiz Nöral Algoritmalar Kullanarak Göğüs Kanseri Teşhisi, Mühendisliği 10. Ulusal Kongresi, İstanbul, Türkiye, 2003.