Açık Kaynak Kodlu Veri Madenciliği Programları: R’da Örnek Uygulama

Ham verilerden anlamlı bilgilere geçiş sürecine veri madenciliği denir. Veri, ham veriler arasında gizli bilgileri çıkarmak için çeşitli veri madenciliği yöntemleri uygulanarak işlenir. İşlenmiş ham veriler, veri madenciliğinin bir sonraki aşamasında kullanılabilir hale gelir. Veri madenciliği ve veri işlemede kullanılmak üzere birçok açık kaynak ve ticari uygulama vardır. Bu çalışmada veri madenciliği programları hakkında bilgi verilmiş ve R programı üzerinde bir vaka çalışması sunulmuştur. R programı, çeşitli grafiklerle de gösterildiği üzere kullanıcılar arasında büyük bir tercih oranına sahip olması dolayısıyla seçilmiştir.

Open Source Data Mining Programs: A Case Study on R

The processes on the way from raw data to meaningful information is called data mining. The data is processed by applying various methods of data mining in order to extract hidden information among raw data. The processed raw data becomes usable in the next steps of data mining. There are many open source and commercial applications to be used in data mining and data processing. In this study, information about data mining programs are given, and a case study on the R program. The R program has been chosen because it has a large preference rate among the users as shown by various graphs.

___

  • M. Clark, “An Introduction to machine learning with Applications in R," Lecture Notes, University of Notre Dame, 2015. [18] P. Flach, “The many faces of ROC analysis in machine learning,” ICML Tutorial, 2004.
  • N. Japkowicz, “Performance evaluation for learning algorithms,” International Conference on Machine Learning, Edinburg, Scotland, 2012.
  • Ş. Özdemir, Eğitsel Veri Madenciliği Çalışması: Lise Öğrencilerinin Okula Devamlılık Durumlarının Öngörülmesi, R ile Veri Madenciliği (Balaban-Kartal), Çağlayan Kitabevi, 2016.
  • M. Kuhn, J. Wing, S. Weston, A. Williams, C. Keefer, A. Engelhardt, C. Candan, (2016, 12 November). Caret: Classification and Regression Training. [Online]. Access: https://cran.rproject.org/pub/R/web/packages/caret/caret.pdf, 2016.
  • T. Horthon, A. Zeileis, (10, January 2016). Partykit Packages, [Online]. Access: https://cran.rproject.org/web/packages/partykit/ partykit.pdf, 2016.
  • T. Hornik, C. Buchta, T. Hothorn, A. Karatzoglou, D. Meyer, A.Zeleis, (11, January 2016). RWeka Packages, [Online]. Access: https://cran.r-project.org/web/packages/RWeka/RWeka.pdf, 2016.
  • T. Therneau, B. Atkinson, B. Ripley, (20, February 2017) Rpart Packages. [Online]. Access: https://cran.r-project.org/web/packages/rpart/rpart.pdf. 2017.
  • Anonymous, (05, January 2018) [Online]. Access: https://www.kdnuggets.com/2016/06/rpython-top-analytics-data-mining-data-science-software.html, 2018.
  • P. Gregory, Top Analytics, Data Science Software – Kdnuggets Software Poll Results, [Online]. Erişim: https://www.kdnuggets.com/2016/06/r-python-top-analytics-data-mining-data-sciencesoftware.html
  • Anonymous, R (12, December 2016) [Online]. Access: https://en.0wikipedia.org/index.php?q=aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvUl8ocHJ vZ3JhbW1pbmdfbGFuZ3VhZ2Up
  • E. Alpaydın, Zeki Veri Madenciliği: Ham Veridan Altın Bilgiye Ulaşma Yöntemleri, 2000.
  • L. B. Ayre, Data Mining For Information Professionals, June, 2006.
  • J. Han, M. Kanber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006. [5] M. J. Berry, G.S. Linoff, Mastering Data Mining, John Wiley&Sons, New York, 2004.
  • Ö. Yalçın, Veri Madenciliği Yöntemleri, 2nd Ed., Papatya Yayıncılık, 2013.
  • [2] M. Kaya, S. A. Özel, “Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Karşılaştırılması”, presented 14th Acad. Inform. Conf., 2014, Mersin, Turkey, 2014.
  • M. Dener, “Açık Kaynak Kodlu Veri Madenciliği Programları:WEKA’da Örnek Uygulama” presented at 11th Acad. Inform.Conf., 2009, Şanlıurfa, Turkey, 2009.
Düzce Üniversitesi Bilim ve Teknoloji Dergisi-Cover
  • Yayın Aralığı: 4
  • Başlangıç: 2013
  • Yayıncı: Düzce Üniversitesi Fen Bilimleri Enstitüsü
Sayıdaki Diğer Makaleler

Kent Planlamasında Ekosistem Hizmetlerinin Rolü

Muzaffer YÜCEL, Ayşen ÇOBAN

Öngerme Kablo Düzeninin Aktarma Dönemi Sonrası Kirişin Gerilme ve Kılıflama Parametremeleri Üzerindeki Etkisi

Şevket ATEŞ, Barbaros ATMACA

İmar Planlarının Hazırlanma Süreci ve Peyzaj Mimarlığı Disiplini Açısından Karşılaşılan Sorunlar

Büşra EZENCİ

Orman Endüstri Mühendislerinin Bakış Açısı ile Lisans Eğitimi

Muhammet ÇİL, Kadri Cemil AKYÜZ, İlter BEKAR, K. Hüseyin KOÇ, Tarık GEDIK, Derya SEVIM KORKUT

IMU ile Tarım Araçlarında Oturma Pozisyonunun Düzeltilmesi

Volkan ÇAVUŞ, İsmail Umut DURAN, Resul TUNA

Elastik Yarı Sonsuz Düzlem Üzerine Oturan Ağırlıklı Tabakanın Sonlu Elemanlar Yöntemi Kullanılarak Sürtünmesiz Temas Problemi Analizi

Alper POLAT, Talat Şükrü ÖZŞAHİN, Yusuf KAYA

Fiber Optik Fabry-Perot Akustik Sensörler için Yeni Bir Diyafram Malzemesi Olarak 2D GaSe Benzetimi

Ömer Galip SARAÇOĞLU, Umut AYDEMİR, Timuçin Emre TABARU, Şekip Esat HAYBER

Doğu Anadolu fay zonu (DAFZ) ve civarının depremselliğinin Poisson ve Üstel dağılım modellerine göre incelenmesi

Nilgün SAYIL, Kaan Hakan ÇOBAN

Sağlık Çalışanlarının İş Sağlığı Önlemlerine Yönelik Görüşlerinin İncelenmesi; Çanakkale’de Bir Kamu Hastanesi Örneği

Ayşin AŞKIN, Ayten DİNÇ

Amasya Üniversitesi Sağlık Yüksekokulu Hemşirelik Öğrencilerinin İlaç Uygulama Hataları

Arif AYAR, Arslan SAY, Emine SİLDİR, Demet ÇAKIROĞLU