Açık Kaynak Kodlu Veri Madenciliği Programları: R’da Örnek Uygulama

Ham verilerden anlamlı bilgilere geçiş sürecine veri madenciliği denir. Veri, ham veriler arasında gizli bilgileri çıkarmak için çeşitli veri madenciliği yöntemleri uygulanarak işlenir. İşlenmiş ham veriler, veri madenciliğinin bir sonraki aşamasında kullanılabilir hale gelir. Veri madenciliği ve veri işlemede kullanılmak üzere birçok açık kaynak ve ticari uygulama vardır. Bu çalışmada veri madenciliği programları hakkında bilgi verilmiş ve R programı üzerinde bir vaka çalışması sunulmuştur. R programı, çeşitli grafiklerle de gösterildiği üzere kullanıcılar arasında büyük bir tercih oranına sahip olması dolayısıyla seçilmiştir.

Open Source Data Mining Programs: A Case Study on R

The processes on the way from raw data to meaningful information is called data mining. The data is processed by applying various methods of data mining in order to extract hidden information among raw data. The processed raw data becomes usable in the next steps of data mining. There are many open source and commercial applications to be used in data mining and data processing. In this study, information about data mining programs are given, and a case study on the R program. The R program has been chosen because it has a large preference rate among the users as shown by various graphs.

___

  • M. Clark, “An Introduction to machine learning with Applications in R," Lecture Notes, University of Notre Dame, 2015. [18] P. Flach, “The many faces of ROC analysis in machine learning,” ICML Tutorial, 2004.
  • N. Japkowicz, “Performance evaluation for learning algorithms,” International Conference on Machine Learning, Edinburg, Scotland, 2012.
  • Ş. Özdemir, Eğitsel Veri Madenciliği Çalışması: Lise Öğrencilerinin Okula Devamlılık Durumlarının Öngörülmesi, R ile Veri Madenciliği (Balaban-Kartal), Çağlayan Kitabevi, 2016.
  • M. Kuhn, J. Wing, S. Weston, A. Williams, C. Keefer, A. Engelhardt, C. Candan, (2016, 12 November). Caret: Classification and Regression Training. [Online]. Access: https://cran.rproject.org/pub/R/web/packages/caret/caret.pdf, 2016.
  • T. Horthon, A. Zeileis, (10, January 2016). Partykit Packages, [Online]. Access: https://cran.rproject.org/web/packages/partykit/ partykit.pdf, 2016.
  • T. Hornik, C. Buchta, T. Hothorn, A. Karatzoglou, D. Meyer, A.Zeleis, (11, January 2016). RWeka Packages, [Online]. Access: https://cran.r-project.org/web/packages/RWeka/RWeka.pdf, 2016.
  • T. Therneau, B. Atkinson, B. Ripley, (20, February 2017) Rpart Packages. [Online]. Access: https://cran.r-project.org/web/packages/rpart/rpart.pdf. 2017.
  • Anonymous, (05, January 2018) [Online]. Access: https://www.kdnuggets.com/2016/06/rpython-top-analytics-data-mining-data-science-software.html, 2018.
  • P. Gregory, Top Analytics, Data Science Software – Kdnuggets Software Poll Results, [Online]. Erişim: https://www.kdnuggets.com/2016/06/r-python-top-analytics-data-mining-data-sciencesoftware.html
  • Anonymous, R (12, December 2016) [Online]. Access: https://en.0wikipedia.org/index.php?q=aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvUl8ocHJ vZ3JhbW1pbmdfbGFuZ3VhZ2Up
  • E. Alpaydın, Zeki Veri Madenciliği: Ham Veridan Altın Bilgiye Ulaşma Yöntemleri, 2000.
  • L. B. Ayre, Data Mining For Information Professionals, June, 2006.
  • J. Han, M. Kanber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006. [5] M. J. Berry, G.S. Linoff, Mastering Data Mining, John Wiley&Sons, New York, 2004.
  • Ö. Yalçın, Veri Madenciliği Yöntemleri, 2nd Ed., Papatya Yayıncılık, 2013.
  • [2] M. Kaya, S. A. Özel, “Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Karşılaştırılması”, presented 14th Acad. Inform. Conf., 2014, Mersin, Turkey, 2014.
  • M. Dener, “Açık Kaynak Kodlu Veri Madenciliği Programları:WEKA’da Örnek Uygulama” presented at 11th Acad. Inform.Conf., 2009, Şanlıurfa, Turkey, 2009.
Düzce Üniversitesi Bilim ve Teknoloji Dergisi-Cover
  • Yayın Aralığı: Yılda 4 Sayı
  • Başlangıç: 2013
  • Yayıncı: Düzce Üniversitesi Fen Bilimleri Enstitüsü