Ders Geçme Notlarının Veri Madenciliği Yöntemleriyle Tahmin Edilmesi

Teknolojinin gelişimi ile veritabanlarının boyutları doğru orantılı olarak ilerlemektedir. Bu kadar çok verinin tutulması sonucu çeşitlianalizler ile bu veriler arasındaki gizli bağlantıların araştırılması kaçınılmaz olmuştur. Buradaki çalışmada öğrencilerin Yabancı Dil-IIdersindeki geçme notları veri madenciliği yöntemleriyle tahmin edilmiştir. Araştırmada Türkiye’deki bir üniversitede Yabancı Dil-IIdersini alan 3794 öğrenci verileri kullanılmıştır. Çalışmada 12’si girdi ve biri çıktı olmak üzere toplam 13 adet değişkenin yer aldığıYapay Sinir Ağları, M5P, DecisionStump, M5Rules, DecisionTable, Bagging yöntemleri ile geliştirilen tahmin modelleri oluşturulmuşve birbirleriyle karşılaştırılmıştır. Verilerin eğitim ve test olarak ayrıştırılmasında 10-katlı çapraz doğrulama yöntemi kullanılmıştır.Modellerde öğrencinin ders geçme notunu etkileyecek öğrenim tipi, fakülte, bölüm, program, program tipi, öğretim elemanı ve unvanı,öğrenci programa giriş türü, giriş puanı ve giriş sıralaması ile bir önceki dönemin not ortalaması dikkate alınmıştır. Modeller arasındaBagging yöntemi ile kurulan modelin en iyi sonuç olan 1.22 ortalama mutlak hata ve 0.80 korelasyon katsayısı ile tahminler ürettiğigörülmüştür. Çalışma sonucunda öğrencilerin ders geçme notunu önceden öğrenip önlemler alacağı düşünülmektedir.

Forecasting of The Course Learning Notes by Data Mining Methods

With the development of technology, the dimensions of the databases are progressively proportional. It is inevitable to investigate the secret links between these analyzes with various analyzes. In this study, the passing grades of the students in Foreign Language-II course were estimated by data mining methods. In the study at a university in Turkey Foreign Language-II 3794 students taking the course data are used. In this study, the estimation models developed by Artificial Neural Networks, M5P, DecisionStump, M5Rules, DecisionTable and Bagging methods were formed and compared with each other. 10-fold cross-validation method was used for training and testing. In the models, the type of the course, faculty, department, program, program type, teaching staff and title, the type of entry to the program, entry point and entry rank and the average grade of the previous semester were taken into consideration. Among the models, it was seen that the model established with Bagging method produced the best results with 1.21 mean absolute error and 0.81 correlation coefficient. As a result of the study, it is thought that the students will learn the course grade and take precautions in advance.

___