Metin Madenciliği İle E-Ticaret Sitelerinin Belirlenmesi

–Bu çalışmada kullanıcı tarafından belirtilen internet sitelerinin içeriğini analiz ederek metin madenciliği yöntemleri kullanarak bu sayfaların elektronik ticaret (e-ticaret) sitesi olup olmadığına karar veren bir uygulama geliştirilmiştir. Uygulama özel çalışmalarda kullanılmak üzere hazırlanmıştır ve kullanıcılara e-ticaret sitelerinin bulunmasını kolaylaştırmayı amaçlamaktadır. Çalışmada metin sınıflandırmada kullanılmak üzere farklı kaynaklardan veriler toplanmış ve kullanıma hazırlanmıştır. Bu veriler üzerinde k-NN En-Yakın-Komşu ve Naïve Bayes sınıflandırma algoritmaları kullanılarak elde edilen sonuçlar karşılaştırılmıştır. Daha iyi sonuç verdiği gözlemlenen algoritma seçilip Java programlama dili ile masaüstü uygulaması olarak hazırlanan ara yüze aktarılarak kullanımına sunulmuştur.

Metin Madenciliği İle E-Ticaret Sitelerinin Belirlenmesi

– In this study, an application which decide whether or not the pages specified by the user are electronic commerce (e-commerce) sites by analyzing the contents of web sites and by using text mining techniques is developed. The application is designed to be used in special studies and aims to facilitate users to find e-commerce sites. In this study, the data was collected from different sources to be used in text classification and prepared for useage. k-NN Nearest Neighbour and Naïve Bayes classification algorithms are used on this data and obtained results are compared. Algorithm that gives better results is selected and a desktop application with the Java programming language is developed for usage.

___

  • [1] İnternet: İnternet, http://tr.wikipedia.org/wiki/%C4%B0nternet/, 08.01.2013.
  • [2] İnternet: H., Takcı, Metin Madenciliği Çerçevesi, http:// verimadencisi.blogspot.com/2012/10/metin-madenciligi-cercevesi.html/, 08.01.2013.
  • [3] İnternet: Doğal Dil İşleme, http://tr.wikipedia.org/wiki/Doğal_dil_ işleme/, 08.01.2013.
  • [4] İnternet: Veri Madenciliği, http://tr.wikipedia.org/wiki/Veri_ madencili%C4%9Fi/, 08.01.2013.
  • [5] C., Coşkun, A., Baykal, “Veri Madenciliğinde Sınıflandırma Algoritmalarının Bir Örnek Üzerinde Karşılaştırılması”, Akademik Bilişim 2011, İnönü Üniversitesi, Malatya, 02-04 Şubat, 2011.
  • [6] G., Silahtaroğlu, F., Demircan, “Çeviri Yazılımlarında Sözcüklerin Bağlam İçindeki Anlamını Algılamaya Yönelik Öneri”, Akademik Bilişim 2013, Akdeniz Üniversitesi Hukuk Fakültesi, Antalya, 23-25 Ocak, 2013.
  • [7] G., Guo, H., Wang, D., Bell, Y., Bi, K., Greer, “Using kNN Model for Automatic Text Categorization”, Soft Computing, 10 (5), 423-430, 2006.
  • [8] Z., Deng, M., Zhang, “Improving Text Categorization Using the Importance of Words in Different Categories”, Computational Intelligence and Security, Xi’an, Çin, 458-463, 15-19 Aralık, 2005.
  • [9] S., Manne, S. K., Kotha, And S.S., Fatima, “Text Categorization with K-Nearest Neighbor Approach”, Information Systems Design and Intelligent Applications 2012, Visakhapatnam, Hindistan, 413-420, Ocak 2012.
  • [10] Y. K., AKIN, Veri Madenciliğinde Kümeleme Algoritmaları ve Kümeleme Analizi, Doktora Tezi, Marmara Üniversitesi, Sosyal Bilimler Enstitüsü, 2008.
  • [11] İ. F., Pilavcılar, Metin Madenciliği ile Metin Sınıflandırma, Yüksek Lisans Tezi, Yıldız Teknik Üniversitesi, FBE Matematik Mühendisliği Anabilim Dalı, 2007.
  • [12] H. K., Yıldız, M., Gençtav, N., Usta, B., Diri, M. F., Amasyalı, “Metin Sınıflandırmada Yeni Özellik Çıkarımı”, 15. Sinyal İşleme, İletişim ve Uygulamaları Kurultayı, Eskişehir, 11-13 Haziran, 2007.
  • [13] V. C., Gandhi, J. A., Prajapati, “Review on Comparison between Text Classification Algorithms”, International Journal of Emerging Trends & Technology in Computer Science (IJETTCS), 1 (3), 2012.
  • [14] S. M., Weiss, C., Apte, F. J., Damerau, D. E., Johnson, F. J., Oles, T., Goetz, T., Hampp, “Maximizing Text-Mining Performance” IEEE Intelligent Systems and Their Applications, New York, 14(4), 63- 69, 1999.
  • [15] K., Wu, B. L., Lu, M., Utiyama, H., Isahara, “An Empirical Comparison of Min–Max-Modular K-NN with Different Voting Methods to Large-Scale Text Categorization”, Soft Computing, 12(7), 647-655, 2008.
  • [16] A., Kehagias, V., Petridis, V.G., Kaburlasosand, P., Fragkou, “A Comparison of Word and Sense-based Text Categorization Using Several Classification Algorithms”, Journal of Intelligent Information Systems, 21(3), 227-247, 2001.
  • [17] İnternet: S., Albayrak, Veri Madenciliği Sınıflama ve Kümeleme Yöntemi, http://www.ce.yildiz.edu.tr/personal/songul/file/332/Veri+Mad encili%C4%9Fi-S%C4%B1n%C4%B1flamaKumeleme.ppt, 17.03.2013.
  • [18] U., İlhan, Application Of KNN and FPTC Based Text Categorization Algorithms to Turkish News Reports, Doktora Tezi, Bilkent Üniversitesi, Mühendislik Fakültesi, 2001.
  • [19] İnternet: C., Janssen, Tokenization, http://www.techopedia.com/ definition/13698/tokenization/, 08.01.2013.
  • [20] K., Çalış, O., Gazdağı, O., Yıldız, “Reklam İçerikli Epostaların Metin Madenciliği Yöntemleri ile Otomatik Tespiti”, Bilişim Teknolojileri Dergisi, 6(1), 1-7, 2013.
  • [21] İnternet: Ş.G., Öğüdücü, “Metin Madenciliği”, http://ninova.itu. edu.tr/tr/dersler/bilisim-enstitusu/195/bbl-606/ekkaynaklar?g33056/, 21.04.2013.
  • [22] C. D., Manning, H., Schütze, Foundations of Statistical Natural Language Processing, 2, MIT Press, Londra, İngiltere, 1999.
  • [23] W., Wang, An Empirical Study on Hierarchical Text Categorization, Yüksek Lisans Tezi, Guelph Ünviversitesi, The Faculty of Graduate Studies, 2007.
  • [24] İnternet: Nearest Neighbor Search, http://en.wikipedia.org/wiki/ Nearest_neighbor_search/, 02.07.2013.
  • [25] S., Eyheralendy, D., Lewis, D., Madigan, “On the Naive Bayes Model for Text Categorization”, Ninth International Workshop on Artificial Intelligence and Statistics, Florida, Amerika Birleşik Devletleri, 3-6 Ocak, 2003.
  • [26] K.A. Vidhya, G. Aghila, “A Survey of Naïve Bayes Machine Learning approach in Text Document Classification”, International Journal of Computer Science and Information Security (IJCSIS), 7(2), 206-211, 2010.
  • [27] İnternet: Dizin Sitesi Nedir?, http://sarkos.net/dizin-sitesi-nedir/, 09.07.2013.
  • [28] İnternet: Meta Tag, http://www.r10.net/meta-tag/206346-meta￾tag-listesi.html/, 05.07.2013.
  • [29] S., Shibu, A., Vishwakarma, N., Bhargava, “A Combination Approach for Web Page Classification Using Page Rank and Feature Selection Technique”, International Journal of Computer Theory and Engineering, 2(6), 897-900, 2010.
  • [30] İnternet: E-Ticaret Genel Özellikleri, http://www.mpluseticaret. com/eticaret_genel_ozellikleri.asp/, 08.08.2013.
  • [31] S., TÜZÜNTÜRK, “Veri Madenciliği ve İstatistik.”, Uludağ Üniversitesi İİBF Dergisi, 29(1), 65-90, 2010.
  • [32] İnternet: Zemberek, http://code.google.com/p/zemberek/ downloads/list, 08.01.2013.
  • [33] İnternet: Zemberek Yazılımı, http://tr.wikipedia.org/wiki/ Zemberek_(yaz%C4%B1l%C4%B1m)/, 08.01.2013