Sınıflandırıcı Topluluklarının Dengesiz Veri Kümeleri Üzerindeki Performans Analizleri

Öz Kolektif öğreniciler diğer bir adıyla sınıflandırıcı toplulukları, sınıflandırmadaki doğruluk oranını artırmak için kullanılan yeni ve yaygın bir yapay öğrenme yöntemidir. Literatürde önerilmiş birçok kolektif öğrenme metodu vardır. Bu öğreniciler önceden hazırlanmış olan etiketli veri setleri üzerinde eğitilerek bir sınıflandırma modeli oluştururlar. Veri setleri içerisinde bulunan her bir sınıf türüne ait örnek sayıları her zaman dengeli olamayabilir. Arıca dengesiz sınıf dağılımların bulunduğu veri setleri üzerinde sınıflandırıcılar istenilen düzeyde performans gösteremeyebilir. Bu çalışmada, yüksek başarı göstermesi beklenen öğrenici topluluklarının dengesiz sınıf dağılımlarına sahip veri setleri üzerindeki sınıflandırma başarıları analiz edilmeye çalışılmıştır.

___

  • [1] Wu, G., Chang, E.Y., "Class-boundary alignment for imbalanced dataset learning". In ICML 2003 workshop on learning from imbalanced data sets II, Washington, DC, 49-56, 2003.
  • [2] He H., "Learning from Imbalanced Data", IEEE Transactions on Knowledge and Data Engineering, 21(9):1263 - 1284, 2009.
  • [3] Han H., Wang W.Y., Mao B.H., Borderline-SMOTE: A New Over-Sampling Method in Imbalanced Data Sets Learning, Springer Berlin Heidelberg 5, 3644: 878-887, 2014.
  • [4] Akbani R., Kwek S., Japkowicz N., "Applying Support Vector Machines to Imbalanced Datasets", Machine Learning: ECML of the series Lecture Notes in Computer Science, vol 3201:39-50, 2004.
  • [5] Kotsiantis S., Kanellopoulos D., Pintelas P., "Handling imbalanced datasets: A review" , GESTS International Transactions on Computer Science and Engineering, Vol.30, 2006.
  • [6] Jian, C., Gao, J., Ao, Y., "A new sampling method for classifying imbalanced data based on support vector machine ensemble", Elsevier Neurocomputing Journal, 1-8, 2016.
  • [7] Haixiang, G., Yijing, L., Yanan, L., Xiao, L., Jinling, L., "BPSOAdaboost-KNN ensemble learning algorithm for multi-class imbalanced data classification", Elsevier Engineering Applications of Artificial Intelligence, Vol 49, 176-193, 2016.
  • [8] Yijing, L., Haixiang, G., Xiao, L., Yanan, L., & Jinling, L., "Adapted ensemble classification algorithm based on multiple classifier system and feature selection for classifying multi-class imbalanced data", Elsevier Knowledge-Based Systems, 94, 88-104, 2016.
  • [9] Zhou, Zhi-Hua. "Ensemble methods: foundations and algorithms", CRC Press, New York, ABD, 2012.
  • [10] Breiman L., "Bagging predictors.", Machine Learning, 24:123-140, 1999.
  • [11] Freund, Y., "A short introduction to boosting", Journal-Japanese Society For Artificial Intelligence, 14(1):771-780, 1999.
  • [12] Breiman, L., "Bias, Variance, and Arcing Classifiers", Technical Report, STATISTICS Department, University Of California, Berkeley, 1996.
  • [13] Tetik, Y.E., "Gürültülü Ortamlarda Konuşma Tespiti İçin Yenibir Öznitelik Çıkarım Yöntemi". Elektrik-Elektronik ve Bilgisayar Sempozyumu. Fırat Üniversitesi-Elazığ, 2011.
  • [14] Ting, K. M., Witten, I. H.: "Stacking Bagged and Dagged Models". 14th International Conference on Machine Learning, San Francisco, CA, 367-375, 1997.
  • [15] Melville P., Mooney R.J.,"Constructing Diverse Classifier Ensembles Using Artificial Training Examples". Eighteenth International Joint Conference on Artificial Intelligence, 505-510, 2003.
  • [16] Ho T.K., "The Random Subspace Method for Constructing Decision", IEEE Transactions on Pattern Analysis and Machine Intelligence, Lucent Tech no l., AT&T Bell Labs., Murray Hill, 20(8):832 - 844, 1998.
  • [17] Matthews B.W., "Comparison of the predicted and observed secondary structure of T4 phage lysozyme". Biochimica et Biophysica Acta (BBA) 405 (2): 442-451, 1975.
  • [18] Demsar J., "Statistical Comparisons of Classifiers over Multiple Data Sets", Journal of Machine Learning Research 7:1-30, 2006.
  • [19] Ulaş A., Yıldız O.T., Alpaydın E., "Cost-conscious comparison of supervised learning algorithms over multiple data sets", Pattern Recognition, 45(4): 1772-1781, 2012.
Bilişim Teknolojileri Dergisi-Cover
  • ISSN: 1307-9697
  • Yayın Aralığı: Yılda 4 Sayı
  • Başlangıç: 2008
  • Yayıncı: Gazi Üniversitesi Bilişim Enstitüsü
Sayıdaki Diğer Makaleler

Quality Assessment for Primary Studies on Identifying Refactoring Opportunities in Object-Oriented Code

Jehad Al DALLAL

The Comparison Study of Hierarchical Routing Protocols for Ad-Hoc and Wireless Sensor Networks: A Literature Survey

Ibrihich OUAFAA, Krit SALAH-DDİNE, Laassiri JALAL, El Hajji SAİD

Tasarsız Ağlarda Yönlendirme Güvenliği Üzerine Kapsamlı Bir Araştırma

Mehmet TEKEREK, Yılmaz VURAL, Murat AYDOS

Adli Bilişim Eğitiminin Gereksinimi ve Genel Olarak Değerlendirilmesi

Merve ORAKCI, Hüseyin ÇAKIR, İbrahim KÖK

İstatistiksel Süreç Kontrolü Prensiplerini Kullanarak Bir Kestirimci Bakım Bilgi Sisteminin Geliştirilmesi

Mehmet Ali ILGIN, Doğa SÖYLER, Kamil SÖZEN

Medline Veritabanı Üzerinde Bulunan Tıbbi Dokümanların Kanser Türlerine Göre Otomatik Sınıflandırılması

Ahmet ALKAN, Ahmet HALTAŞ

A Study on Estimation of Wind Speed Distribution by Using the Modified Weibull Distribution

Yeliz Mert KANTAR, Ilhan USTA, Ismail YENİLMEZ, Ibrahim ARIK

Örgütsel Bağlılık, Örgütsel Özdeşleşme, Kişi-Örgüt Uyumu ve İş Tatmini İlişkisi: Bilişim Uzmanlarına Yönelik Bir Araştırma

Yunus BIYIK, Alptekin SÖKMEN

Usability Benchmarks for Interactive Whiteboards: Lessons Learned from Turkey's Fatih Project

Pınar DURDU ONAY, Ali UÇAR

Comparison of Some Estimation Methods of the two parameter Weibull Distribution for Unusual Wind Speed Data Cases

Yeliz MERT Kantar, Ibrahim ARIK, Ilhan USTA, Ismail YENİLMEZ