Karar Ağaçları ile Bir Web Sitesinde Link Analizi ve Tespiti

Web siteleri metinler, resimler, videolar gibi içerikler ile ziyaretçilerine bilgi vermeyi amaçlayan uygulamalardır. Web sitesi ana sayfasının sitenin bir özeti olması ve çok tıklanan, çok zaman geçirilen ya da hemen çıkma oranı düşük olan alt sayfaların linklerini barındırması beklenmektedir. Büyük web siteleri yüzlerce ya da binlerce alt sayfa içermektedir. Bu alt sayfaların hepsinin linklerinin ana sayfaya konulması, ana sayfanın karmaşık bir hal almasına neden olur.  Bu çalışmada, bir web sitesinin Google Analitik verilerini kullanarak, veri madenciliği yöntemiyle ana sayfada olması gereken linklerin tespitini yapabilmek için bir karar ağacı oluşturulmuştur. Oluşturulan karar ağacı mevcut ya da yeni yapılacak bir  web sitesinin ana sayfasında olması gereken alt sayfalarının linklerinin tespitinde kullanılabilir. Böylelikle ana sayfanın daha işlevsel olması, ziyaretçilerin girmek istedikleri alt sayfaları daha hızlı bulmaları sağlanabilir.    

Link Analysis and Detection in a Web Site With Decision Trees

Web sites are web-based applications that intend to inform their visitors through contents such as texts, visuals and videos. The home page of a web site must be a summary of the web site. Home page must host the links for frequently or long-term visited sub-pages with lower possibility to exit immediately. Big web sites have hundreds or thousands of sub-pages. If the links of all these sub-pages are given in the home page, the page can become messed. In this research, a decision tree was formed through data mining method using Google Analytic data in order to identify the links necessary to be given in the home page of a web site. The decision tree can be used for the identification of the links of the sub-pages necessary to be given in the home page of a current or future web site. This can support the functionality of the home page and help the visitors easily find the sub-pages they would like to enter into.    

___

  • Resul, D., İ. Türkoğlu, ve M. Poyraz, “Bir Web Sitesine Ait Kullanıcı Erişim Kayıtlarının Web Kullanım Madenciliği Yöntemiyle Analizi: Fırat Üniversitesi Örneği.” e-Journal of New World Sciences Academy 2008. 3(2).
  • Daş, R., İ. Türkoğlu, ve M. Poyraz, “Web Kayıt Dosyalarından İlginç Örüntülerin Keşfedilmesi.” Fırat Üniversitesi Fen ve Mühendislik Bilimleri Dergisi, 2007. 19(4): p. 493-503.
  • Tuğ, E., M. Şakiroğlu, ve A. Arslan, “Automatic discovery of the sequential accesses from web log data files via a genetic algorithm.” Knowledge-Based Systems, 2006. 19(3): p. 180-186.
  • Carmona, C.J., et al., “Web usage mining to improve the design of an e-commerce website: OrOliveSur. com.” Expert Systems with Applications, 2012. 39(12): p. 11243-11249.
  • Parvatikar, S. and B. Joshi. “Analysis of user behavior through web usage mining.” ICAST–International Conference on Advances in Science and Technology. 2014. Citeseer.
  • Özkan, Y., “Veri madenciliği yöntemleri.” 2008: Papatya Yayıncılık Eğitim.
  • Silahtaroğlu, G., “Veri madenciliği.” Papatya Yayınları, İstanbul, 2008.
  • Alpaydın, E., “Zeki veri madenciliği: Ham veriden altın bilgiye ulaşma yöntemleri.” Bilişim 2000 eğitim semineri, 2000.
  • Han, J. and M. Kamber, “Data mining: concepts and techniques (the Morgan Kaufmann Series in data management systems).” 2000.
  • Akpınar, H., “Veri tabanlarında bilgi keşfi ve veri madenciliği.” İÜ İşletme Fakültesi Dergisi, 2000. 29(1): p. 1-22.
  • Shannon, C., “A Mathematical Theory of Communication.” The Bell System Technical Journal, 1948. 27.
  • Quinlan, J.R., “C4. 5: programs for machine learning.” 2014: Elsevier.
  • Parmaksız, M.Y., “Google Analytics.” Dikeyeksen Yayınevi, İstanbul, 2013.
  • Weka 3: Java’da Veri Madenciliği Yazılımı. (n.d.) http://www.cs.waikato.ac.nz/ml/weka/index.html