Gini Algoritmasını Kullanarak Karar Ağacı Oluşturmayı Sağlayan Bir Yazılımın Geliştirilmesi

Günümüzde veri madenciliğinin kullanımı yaygınlaşmış ve veri setleri devasa boyutlara ulaşmıştır. Bu veri setlerine veri madenciliği modellerini uygulamak ve detaylı analizler elde edebilmek için çeşitli araçlara ihtiyaç duyulmaktadır. Piyasada bu tür araçların bulunmasına rağmen kolay kullanım ve detaylı analizlere sahip araçların sayısı azdır ve bu araçlar genelde maliyeti fazla araçlardır. Dolayısıyla kolay kullanıma sahip veri madenciliği modellerini uygulayabilecek ücretsiz araçlara ihtiyaç duyulmaktadır. Bu çalışmada veri madenciliği modellerinden Gini algoritmasını veri seti üzerine uygulayıp karar ağacı oluşmasını sağlayan bir yazılım geliştirilmiştir.

─ Today, the use of data mining become widespread and data sets has become very huge. Various tools are needed to Apply data mining models to these data sets and to get detailed analyses from those. Although there are similar tools available in the market, there aren’t many tools which have easy to use and doing detailed analysis. Therefore there is a need for free software that has easy to use and can apply data mining models. In this study software that can apply Gini algorithm which is a data mining model to data sets and create decision trees has developed.

___

  • [1] F. Berzal, J. C. Cubero, Jimenez A., The design and use of the TMiner component-based data mining framework, Expert Systems with Applications, 36, 7882-7887, 2009.
  • [2] J. A. Fdez, S. Garcia, Berlanga F. J., KEEL: A data mining software tool integrating genetic fuzzy systems, 3rd International Workshop on Genetic and Evolving Fuzzy Systems,84-88 ,March, 2008.
  • [3] V Gorodetsky., O. Karsaeyv, Samoilov V., Software tool for agent-based distributed data mining, KIMAS 2003 Boston, USA.
  • [4] R. Bose, V. Sugumaran, IDM: an intelligent software agent based data mining environment, International Conference on Systems Man and Cybernetics,2888-2893 ,11-14 Oct. 1998.
  • [5] F. Bhat, M. Oussalah, K. Challis, T. Schnier, A software system for data mining with Twitter, 10th IEEE International Conference On Cybernetic Intelligent Systems, 139-144 ,1-2 Sept. London, UK, 2011.
  • [6] R. Robu, V. S. Tivadar, Arff convertor tool for WEKA data mining software, International Joint Conferences on Computational Cybernetics and Technical Informatics, 247- 251,27-29 May. Timisora, Romania, 2010.
  • [6] D. Hand, H. Mannila, P. Smyth, Principles of data mining, 1st ed., A Bradford Book The MIT Press, London, 2001.
  • [7] A. Berson, S. Smith, K. Thearling, “Building Data Mining Applications for CRM”, McGraw-Hill Professional Publishing, New York, USA, (2000).
  • [8] S. Chaudhuri, Data Mining and Database Systems : Where is the Intersection?, IEEE Bulletin of the Technical Committee on Data Engineering, 21 (1) (1998) 4 - 8.
  • [9] S. Özekeş, A. Y. Çamurcu, Classification and prediction in a data mining application, Journal of Marmara for Pure and Applied Sciences, 18/159-174, 2002.
  • [10] L. Breiman, J.H. Friedman, R.A. Olshen, C.J. Stone, Classification and Regression Trees, Wadsworth, Belmont, 1984.
  • [11] Y. Özkan, Veri Madenciliği Yöntemleri, 1st ed., Papatya yayıncılık, Türkiye, 2008.
  • [12] M. A. Little, P.E. McSharry, S. J. Roberts, D. A. E. Costello, I. M. Moroz, 'Exploiting Nonlinear Recurrence and Fractal Scaling Properties for Voice Disorder Detection',. BioMedical Engineering OnLine 2007, 6:23 (26 June 2007).
  • [13] A. Dirican, Evaluation of the diagnostic test's performance and their comparisons. CerrahpaĢa J Med , 32 (1): 25-30, 2001.
  • [14] L. Tomak, Y. Bek, İşlem Karakteristik Eğrisi Analizi Ve Eğri Altında Kalan Alanların Karşılaştırılması, Journal of Experimental and Clinical Medicine, Vol:27, no:2, s:58-65, 2010.