Açık Kaynak Kodlu Veri Madenciliği Programları: R 'da Örnek Uygulama

Ham verilerden anlamlı bilgilere geçiş sürecine veri madenciliği denir. Veri, ham veriler arasında gizli bilgileri çıkarmak için çeşitli veri madenciliği yöntemleri uygulanarak işlenir. İşlenmiş ham veriler, veri madenciliğinin bir sonraki aşamasında kullanılabilir hale gelir. Veri madenciliği ve veri işlemede kullanılmak üzere birçok açık kaynak ve ticari uygulama vardır. Bu çalışmada veri madenciliği programları hakkında bilgi verilmiş ve R programı üzerinde bir vaka çalışması sunulmuştur. R programı, çeşitli grafiklerle de gösterildiği üzere kullanıcılar arasında büyük bir tercih oranına sahip olması dolayısıyla seçilmiştir.

Open Source Data Mining Programs: A Case Study on R

The processes on the way from raw data to meaningful information is called data mining. The data is processed by applying various methods of data mining in order to extract hidden information among raw data. The processed raw data becomes usable in the next steps of data mining. There are many open source and commercial applications to be used in data mining and data processing. In this study, information about data mining programs are given, and a case study on the R program from these programs have been done.

___

  • [1] M. Dener, “Açık Kaynak kodlu Veri Madenciliği Programları:WEKA’da Örnek Uygulama” presented at 11th Acad. Inform.Conf., 2009, Şanlıurfa, Turkey, 2009.
  • [2] M. Kaya, S. A. Özel, Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Karşılaştırılması, presented 14th Acad. Inform. Conf., 2014, Mersin, Turkey, 2014.
  • [3] Ö. Yalçın, Veri Madenciliği Yöntemleri, 2nd Ed., Papatya Yayıncılık, 2013.
  • [4] J. Han, M. Kanber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006.
  • [5] M.J. Berry, G.S. Linoff, Mastering Data Mining, John Wiley&Sons, New York, 2004.
  • [6] L.B.Ayre, Data Mining For Information Professionals, June, 2006.
  • [7] E. Alpaydın, Zeki Veri Madenciliği: Ham Veridan Altın Bilgiye Ulaşma Yöntemleri, 2000.
  • [8] Anonymous, R (Programming Language) [Online]. Available: https://en.0wikipedia.org/index.php?q=aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvUl8ocHJvZ3JhbW1pbmdfbGFuZ3VhZ2Up
  • [9] P. Gregory, Top Analytics, Data Science Software – Kdnuggets Software Poll Results, [Online]. Available: https://www.kdnuggets.com/2016/06/r-python-top-analytics-data-mining-data-science-software.html
  • [10] van Buuren, Stef, et al. Mice Packages, Computer software. Retrieved from: http://cran. r-project. org/web/packages/mice/mice.pdf (2015).
  • [11] T. Therneau, B. Atkinson, B. Ripley, Rpart Packages. [Online]. Available: https://cran.r-project.org/web/packages/rpart/rpart.pdf. 2017.
  • [12] T. Hornik, C. Buchta, T. Hothorn, A. Karatzoglou, D. Meyer, A.Zeleis, RWeka Packages, [Online]. Available: https://cran.r-project.org/web/packages/RWeka/RWeka.pdf, 2016.
  • [13] T. Horthon, A. Zeileis, Partykit Packages, [Online]. Available: https://cran.r-project.org/web/packages/partykit/ partykit.pdf, 2016.
  • [14] M. Kuhn, J. Wing, S. Weston, A. Williams, C. Keefer, A. Engelhardt, C. Candan, Caret: Classification and Regression Training, [Online]. Available: https://cran.r-project.org/pub/R/web/packages/caret/caret.pdf, 2016.
  • [15] Ş. Özdemir, “Eğitsel Veri Madenciliği Çalışması: Lise Öğrencilerinin Okula Devamlılık Durumlarının Öngörülmesi”, R ile Veri Madenciliği (Balaban-Kartal), Çağlayan Kitabevi, 2016