Veri madenciliği ve istatistik

Bu çalışmanın konusu veri madenciliği ve istatistik ile ilgilidir. Bu çalışmanın amacı veri madenciliği ve istatistik arasındaki ilişkinin açıkça ortaya konmasıdır. Bu çalışma ile veri madenciliği süreci sunulmuştur, böylece veri madenciliğinin istatistik ile ayrı tutulamaz olduğu vurgulanmıştır. Teorik veri madenciliği açıklamalarına ilave olarak, OLAP küpleri ile küçük bir veri madenciliği uygulaması da yapılmıştır.

The subject of this study is about data mining and statistics. The aim of this study is to state clearly the relationship between data mining and statistics. By this study the process of data mining is presented, thus it is stressed that data mining can not be excluded from statistics. In addition to theoretic data mining explanations, a small data mining application is also applied with OLAP cubes.

___

Abdelmelek, S. B., Saidane, S., Trabelsi, M. (2010) “Base Oils Biodegradability Prediction with Data Mining Techniques”, Algorithms, Vol. 3, pp. 92–99.

Albayrak, A. S. ve Yılmaz, Ş. K. (2009) “Veri Madenciliği: Karar ağacı Algoritmaları ve İMKB Verileri Üzerine Bir Uygulama”, Süleyman Demirel Üniversitesi İktisadi ve İdari Bilimler Dergisi, Cilt 14, Sayı 1, s. 31–52.

Akpınar, H. (2000) “Veri Tabanlarında Bilgi Keşfi ve Veri Madenciliği”, İstanbul Üniversitesi İşletme Fakültesi Dergisi, Cilt 29, Sayı 1/Nisan, s. 1–22.

Alpaydın, E. (2000) “Zeki Veri Madenciliği: Ham Veriden Altın Bilgiye Ulaşma Yöntemleri”, Bilişim 2000 Eğitim Semineri.

Ata, H. A ve Seyrek, İ. H. (2009), “The Use of Datamining Techniques in Detecting Fraudulent Financial Statements: An Application on Manufacturing Firms”, Süleyman Demirel Üniversitesi İktisadi ve İdari Bilimler Dergisi, Cilt 14, Sayı 2, s. 157–170.

Ayesha, S., Mustafa, T., Sattar, A. R. ve Khan, M. I. (2010), “Data Mining Model for Higher Education System”, European Journal of Scientific Research, Vol. 43, No. 1, pp. 24–29.

Baykasoğlu, A. (2005) “Veri Madenciliği ve Çimento Sektöründe Bir Uygulama”, Akademik Bilişim Konferansı, 2–4 Şubat Gaziantep Üniversitesi.

Bayram, N. (2009) Sosyal Bilimlerde SPSS ile Veri Analizi, Ezgi Kitabevi, Bursa.

Bozkır, A. S., Gök, B. ve Sezer E. (2008) “Üniversite Öğrencilerinin İnterneti Eğitimsel Amaçlar için Kullanmalarını Etkileyen Faktörlerin Veri Madenciliği Yöntemleriyle Tespiti”, Bilimde Modern Yöntemler Sempozyumu, 15-17 Ekim 2008, Eskişehir Osmangazi Üniversitesi Kongre Merkezi, Eskişehir.

Chien, C. F. and Chen L. F. (2008), “Data Mining to Improve Personel Selection and Enhance Human Capital: A Case Study in High Technology Industry”, Expert Systems with Applications, Vol. 34, pp. 280–290.

Çiflikli, C. and Özyirmidokuz, E. K. (2010), “Implementing a Data Mining Solution for Enhancing Carpet Manufacturing Prouctivity”, Knowledge-Based Systems, In Pres.

CRISP-DM 1.0 Step-by-step data mining guide (http://www.crispdm. org/CRISPWP-0800.pdf, erişim tarihi 29.10.2008).

Dasu, T. ve Johnson, T. (2003) Explarotary Data Mining and Data Cleaning, John Wiley & Sons Publication, New Jersey, USA.

Daş, R. , Türkoğlu, İ. ve Poyraz, M. (2007) “Web Kayıt Dosyalarında İlginç Örüntülerin Keşfedilmesi”, Fırat Üniversitesi Fen ve Mühendislik Bilimleri Dergisi, Cilt 19, Sayı 4, s. 493–503.

Deshpande, G., Gogolak, V., ve Smith, S. W. (2010) “Data Mining in Drug Safety”, Pharm Med., Vol. 24, No. 1., pp. 37–43.

Duru, N. ve Canbay, M. (2007) “Veri Madenciliği ile Deprem Verilerinin Analizi”, Uluslar arası Deprem Sempozyumu, Kocaeli Üniversitesi, Kocaeli, 22–26 Ekim 2007.

Emel, G. ve Taşkın, Ç. (2005a) “Veri Madenciliğinde Karar Ağaçları ve Bir Satış Analizi Uygulaması”, Eskişehir Osmangazi Üniversitesi Sosyal Bilimler Dergisi, Cilt 6, Sayı 2, s. 221–236.

Emel, G. ve Taşkın, Ç. (2005b) “Pazarlama Stratejilerinin Oluşturulmasında bir Karar Destek Aracı: Birliktelik Kuralı Madenciliği” Dokuz Eylül Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, Cilt 7, Sayı 3, 2005.

Emel, G., Taşkın, Ç. ve Kılıçaslan, S. (2004) “Sinir Ağları Veri Madenciliği ile Çelik Üretim Sürecinde Bir Analiz”, Dokuz Eylül Üniversitesi İşletme Fakültesi Dergisi, Cilt 5, Sayı 1, s. 205-225.

Friedman, J. H. (1997) “Data Mining and Statistics: What’s the Connection?”, http://www-stat.stanford.edu/~jhf/ (Erişim tarihi, 29.10.2008).

Ganesh, S. (2002) “Data Mining: Should it be included in the ‘Statistics’ cirriculum?”, The Sixt International Conference on Teaching Statistics, Cape Town, South Africa, 7–12 July.

Gervilla, E., Cajal, B., Roca, J. ve Palmer, A. (2010) “Modelling Alcohol Consumption During Adolescence Using Zero Inflated Negative Binomial and Decision Trees”, The European Journal of Psychology Applied to Legal Context, Vol 2, No. 2, pp. 145–159.

Glasgow, J. M. ve Kaboli, P. J. (2010) “Detecting adverse drug events through data mining”, Am J Health-Syst Pharm, Vol. 67, pp. 317–320.

Gürbüz, Özbakır ve Yapıcı, (2009) “Türkiye’de Bir Havayolu İşletmesine ait Söküm Raporlarına İlişkin Veri Madenciliği Uygulaması”, Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, Cilt 24, Sayı 1, s. 73–78.

Gürsakal, N. (2002) Bilgisayar Uygulamalı İstatistik II, Alfa Yayın Dağıtım, İstanbul.

Gürsakal, N. (2001) Sosyal Bilimlerde Araştırma Yöntemleri, Uludağ Üniversitesi Basımevi, Bursa.

Gürsakal, N. (2007) Betimsel İstatistik Minitab, Spss, Statistica, Excel Uygulamalı, Nobel Yayın Dağıtım, Ankara.

Halaç, O. , (1991) Kantitatif Karar Verme Teknikleri: Yöneylem Araştırması, Evrim Yayınları, İstanbul.

Koyuncugil, A. S. (2007) “Veri Madenciliği ve Sermaye Piyasalarına Uygulaması”, Sermaye Piyasası Kurulu Araştırma Raporu, Araştırma Dairesi, 28.02.2007 ASK/1.

Kumar, N. V. A. ve Uma, G. V. (2009) “Improving Academic Performance of Students by Appyling Data Mining Technique”, European Journal of Scientific Research, Vol. 34., No. 4, pp. 526–534.

Kuonen, D. (2004) “Data Mining and Statistics: What is the Connection?”, The Data Administration Newsletter, http://www.tdan.com/view-articles/5226/ (Erişim tarihi, 29.10.2008).

Kusiak, A. and Smith, M. (2007) “Data Mining in Design of Products and Production Systems”, Annual Reviews in Control, Vol. 31, Issue 1, pp. 147–156.

Liang, Yi-Hui (2010) “Integration of data mining techniques to analyze customer value for the automotive maintenance industry”, Expert Systems with Applications, Vol. 37, pp. 7489–7496.

Liao, S.H., Chen, J. L. ve Hsu, T.Y. (2009) “Ontology-Based Data Mining Appoach Implemented for Sport Marketing”, Expert Systems with Applications, Vol. 36, Issue 8, pp. 11045–11056.

Naveh, I. M. H. Sariri, I. ve Zadeh, B. A. (2009) “An Approach of Fault Detection and Prediction in Boiler of Power Plant Using Data-Mining: a Case Study of Application of Artificial Neural Network Technique”, International Review of Modelling and Simulations, Vol. 2, No. 4., pp. 458–464.

Ogwueleka, F. N. (2009) “Potential Value of Data Mining for Customer Relationship Marketing in the Banking Industry”, Advances in Natural and Applied Sciences, Vol. 3, Issue 1, pp. 73–78.

Oğuzlar, A. (2003) “Veri Önişleme”, Erciyes Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, Sayı 21/ Temmuz-Aralık, s. 67–76.

Oğuzlar, A. (2004) Veri Madenciliğine Giriş, Ekin Kitabevi, Bursa.

Oğuzlar, A. (2007) İstatistiksel Veri Analizi, Ezgi Kitabevi, Bursa.

Oğuzlar, A. ve Tüzüntürk, S., (2008) "Metin Madenciliğinin İşletmeler Açısından Önemi ve FMEA İçin Küçük Bir Uygulama Örneği", 9. Türkiye Ekonometri ve İstatistik Kongresi, Dokuz Eylül Üniversitesi, Kuşadası, 28- 30 Mayıs 2008.

Özçakır, F. C. ve Çamurcu, A. Y. (2007) “Birliktelik Kuralı Yöntemi için Bir Veri Madenciliği Yazılımı Tasarımı ve Uygulaması”, İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, Sayı 12/2, s.21–37.

Özdamar, K. (2004 a) Paket Programlar ile İstatistiksel Veri Analizi (Çok Değişkenli Analizler), Kaan Kitabevi, Eskişehir.

Özdamar, K. (2004 b) Paket Programlar ile İstatistiksel Veri Analizi, Kaan Kitabevi, Eskişehir.

Özkul, F. U. ve Pektekin, P. (2009) “Muhasebe Yolsuzluklarının Tesbitinde Adli Muhasebecinin Rolü ve Veri Madenciliği Tekniklerinin Kullanılması”, MODAV, Cilt 4, s.57–87.

Özmen, Ş. (2001) “İş Hayatı Veri Madenciliği ile İstatistik Uygulamalarını Yeniden Keşfediyor”, V. Ulusal Ekonometri ve İstatistik Sempozyumu, Çukurova Üniversitesi, Adana, 19–22 Eylül, 2001.

Rebbapragada, S., Basu, A. ve Semple, J. (2010) “Data Mining and Revenue Management Methodologies in College Admission”, Communications of the ACM, Vol. 53, No. 4, pp. 128–133.

Seng, Jia-Lang ve Cheng, T. C. (2010) “An analytic approach to select data mining for business decision” , Expert Systems with Applications, Vol. 37, pp. 8042–8057.

Serper, Ö. (1996) Uygulamalı İstatistik 2, Filiz Kitabevi, İstanbul.

Srinivas ve Harding, J. A. (2010) “A data mining integrated architecture fors hop flor control”, Proc. IMechE, Vol. 222, Part B, pp. 605–624.

Şentürk, A. (2006) Veri Madenciliği Kavram ve Teknikler, Ekin Kitabevi, Bursa.

Tatlıdil, H. (2002) Uygulamalı Çok Değişkenli İstatistiksel Analiz, Akademi Matbaası, Ankara.

Ural, K., (1973) İstatistik ve Karar Alma, İstanbul Üniversitesi Yayınları, İstanbul.

Vahaplar, A. ve İnceoğlu M. “Veri Madenciliği ve Elektronik Ticaret”, www.bayar.edu.tr/baum/dokümanlar (erişim tarihi, 29.10.2008).

Yıldırım, P., Uludağ, M. ve Görür, A. (2007), “Hastane Bilgi Sistemlerinde Veri Madenciliği”, Akademik Bilişim Kongresi, Çanakkale Onsekiz Mart Üniversitesi, Çanakkale, 30 Ocak-1 Şubat 2007.

Zhang, Y., Ma, J., Zhang J. ve Wang, Z. (2009), “Applications of Data Mining Theory in Electrical Engineering”, Engineering, Vol. 1, pp. 79–83.

Zhao Chung-Mei ve Luan, J. (2006) “Data Mining: Going Beyond Traditional Statistics”, New Directions for Institutional Research, No. 131, pp. 7–16.