Veri Analizinde İstatistik mi Veri Madenciliği mi?

Öz Günümüzün teknolojik gelişmeleri, veri boyutlarının ve çeşitliliğinin artması klasik istatistiksel yöntemlerin yetersiz kalabileceği durumları da beraberinde getirmektedir. Veri analizinde yıllardır kullanılan istatistik, son yıllarda veri madenciliği ile yan yana yer almaktadır. Veri analizi çalışmalarında kullanılan istatistik ve veri madenciliği yöntemleri birçok farklı araştırma alanında kendilerine yer bulabilmektedir.  Özellikle sağlık alanında veri analizinde istatistik sıklıkla kullanılmakta, veri madenciliği yöntemleri ise son yıllarda araştırmacılar tarafından fark edilmektedir. Bu çalışmanın amacı, her iki alanın incelenerek aralarındaki farklılıkların ve benzerliklerin ortaya konmasıdır. Özellikle sağlık alanında veri madenciliğinin çok yaygın olarak bilinmemesi ve sağlık çalışanlarının genellikle istatistiksel yöntemlere bağlı kalıyor olması çalışmanın çıkış noktasını oluşturmaktadır. Çalışma kapsamında veri madenciliği ve istatistiksel yöntemlerle ilgili olarak bir literatür araştırması yapılmıştır. Sonuç olarak bu iki alan kavramsal açıdan incelenmiş, aralarındaki farklar ve benzerlikler özetlenerek ortaya konmaya çalışılmıştır. İlerleyen zamanlarda çalışmanın sağlık verisi ile uygulaması yapılarak genişletilmesi umulmaktadır.
Anahtar Kelimeler:

Veri Madenciliği, İstatistik

___

  • [1] D. Kuonen, "Data Mining and Statistics: What is the Connection?," The Data Administration Newletter, 2004.
  • [2] M. Davidian and T. A. Louis, "Why Statistics?," Science, 336, 12, 2012.
  • [3] İnterner: J. Aldrich, "Figures from the History of Probability & Statistics," Ekim 2012. http://www.economics.soton.ac.uk/staff/aldrich/Figures.htm, 31.05.2016.
  • [4] U. Fayyad, G. Piatetsky-Shapiro, and P. Smyth, "From data mining to knowledge discovery in databases," AI Mag., 17 (2), 37, 1996.
  • [5] U. Fayyad, Piatetsky-Shapiro, and P. Smyth, "The KDD Process for Extracting Useful Knowledge from Volumes of Data," Communıcatıons Of The ACM, 39(11), 27-34, 1996.
  • [6] S. Savaş, N. Topaloğlu, and M. Yılmaz, "Veri madenciliği ve Türkiye'deki Uygulama Örnekleri," İstanbul. Ticaret Üniversitesi Fen Bilimleri Dergisi, 11(21), 1-23, 2012.
  • [7] İnternet: YÖK, "Ulusal Tez Merkezi," 2016. https://tez.yok.gov.tr/UlusalTezMerkezi/giris.jsp, 29.06.2016.
  • [8] M. E. Balaban and E. Kartal, Veri Madencilği ve Makine Öğrenmesi, 1. baskı, Çağlayan Kitapevi, İstanbul, 2015.
  • [9] D. Kumar and D. Bhardwaj, "Rise of Data Mining: Current and Future Application Areas," International Journal of Computer Science Issues, 8(5), 256-260, 2011.
  • [10] H. Akpınar, Data: Veri Madenciliği Veri Analizi, 1.baskı, Papatya Yayıncılık Eğitim, İstanbul, 2014.
  • [11] A. Kapoor, "Data Mining: Past, Present and Future Scenario," International Journal of Emerging Trends & Technology in Computer Science (IJETTCS), 3(1), 95-99, 2014.
  • [12] Y. Özkan, Veri Madenciliği Yöntemleri, 1.baskı, Papatya Yayıncılık Eğitim, İstanbul, 2008.
  • [13] S. Ganesh, "Data mining: Should it be included in the statistics curriculum?", The 6th International Conference on Teaching Statistics (ICOTS 6), Cape Town, Güney Afrika, 2002
  • [14] A. S. Koyuncugil and N. Özgülbaş, "Veri Madenciliği: Tıp ve Sağlık Hizmetlerinde Kullanımı ve Uygulamaları," Bilişim Teknolojileri Dergisi, 2(2), Mayıs 2009.
  • [15] H. Akpınar, "Veri Tabanlarında Bilgi Keşfi ve Veri Madenciliği," İÜ İşletme Fakültesi Dergisi, 29(1), 1-22, 2000.
  • [16] S. Tüzüntürk, "Veri Madenciliği ve İstatistik," Uludağ Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi,29(1), 65-90, 2010.
  • [17] S. Güllüoğlu, "Tıp ve Sağlık Hizmetlerinde Veri Madenciliği Çalışmaları: Kanser Teşhisine Yönelik Bir Ön Çalışma," AJIT-E AJIT-e: Online Academic Journal of Information Technology, 2(5), 2011. [18] E. Kaya, M. Bulun, and A. Arslan, "Tıpta Veri Ambarları Oluşturma ve Veri Madenciliği Uygulamaları,", Akademik Bilişim, Çukurova Üniversitesi, Adana, 3-5 Şubat, 2003.
  • [19] Ç. Erol and Y. Özkan, "Temel Biyoloji ve Mikrodizi," in Biyoenformatik DNA Mikrodizi Veri Madenciliği, 2.baskı, Papatya Yayıncılık Eğitim, İstanbul, 51-81, 2015.
  • [20] M. Ö. Dolgun, T. Güzel Özdemir, and D. Oğuz, "Veri Madenciliğinde Yapısal Olmayan Verinin Analizi: Metin ve Web Madenciliği," İstatistikçiler Dergisi, 2, 48-58, 2009.
  • [21] Ç. Kurt and O. A. Erdem, "Öğrenci Başarısını Etkileyen Faktörlerin Veri Madenciliği Yöntemleriyle İncelenmesi," Politeknik. Dergisi., 15(2), 111-116, 2012.
  • [22] D. Meschenmoser, "Data Mining und Statistik: Gemeinsamkeiten und Unterschiede," Şubat 2004.
  • [23] H. Mannila, "Data Mining: Machine Learning, Statistics and Databases," SSDBM '96 Proceedings of the Eighth International Conference on Scientific and Statistical Database Management, Stockholm, 2-9, 1996.
  • [24] C.-M. Zhao and J. L. Vice, "Data mining: Going beyond traditional statistics," New Directions for Institutional Research., 131, 7- 16, Eylül 2006.
  • [25] İnternet: J. S. Baehr, "A Priori and A Posteriori", http://www.iep.utm.edu/apriori/, 22.06.2016