Veri madenciliği’nde yapısal olmayan verinin analizi: Metin ve web madenciliği

Verinin büyük boyutlara ula$mas ve bilgisayar donan mlar n n bu büyük boyuttaki veriyi depolayarak yüksek kapasitede analiz yapabilecek seviyelere gelmeleri ile birlikte analistler karma$ k ko$ullar ile kar$ kar$ ya kalmaktad rlar. Bu karma$ k ko$ullar n ço u yap sal olmayan verinin etkin bir $ekilde saklanmas ve analizi ile ili$kilidir. Merrill Lynch, potansiyel olarak kullan lan bütün verilerin yakla$ k %80’inin yap sal olmayan türde oldu unu ifade etmi$tir. Bu büyük ve karma$ k yap daki yap sal olmayan veri analistlere yeni f rsatlar açmaktad r. Bu çal $mada, yap sal olmayan verinin metin ve web madencili i yöntemleri ile yap sal hale dönü$türülmesi sonucu modele dahil edilmesinin, model ba$ar s na yapaca katk analiz edilmi$tir. Karar a ac yöntemlerinden C5.0 algoritmas kullan larak elde edilen modeller birbirleri ile kar$ la$t r lm $ ve en iyi model tespit edilmi$tir

Veri madenciliği’nde yapısal olmayan verinin analizi: Metin ve web madenciliği

Keywords:

-,

___

  • Chakrabarti, S. (2003), Mining the Web: Discovering Knowledge from Hypertext Data, Morgan Kaufmann Publishers, San Francisco.
  • Dolgun, M.Ö. (2006), Büyük Al $veri$ Merkezleri Kçin Veri Madencili i Uygulamalar , Yüksek Lisans Tezi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü, Ankara.
  • Han, J., Kamber, M. (2001), Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, San Francisco.
  • Hearst, M. (2009), What is text mining, http://www.sims.berkeley.edu/~hearst/textmining.html.
  • Introduction to Text Mining (2008), SPSS Inc.
  • Liu, B. (2007), Web Data Mining: Exploring Hyperlinks, Contents and Usage Data, Springer.
  • Özdemir Güzel, T., Dolgun, M.Ö., Pat r, U., Delilo lu, S., Korkmaz, H.E. (2007), 2005 Y l Ö renci Seçme S nav (ÖSS) Verileri Kullan larak Ö renci Profilinin Belirlenmesi, 5. +statistik Kongresi, Antalya.
  • Shapiro-Piatetsky, G., Steingold, S. (2000), Measuring Lift Quality in Database Marketing, ACM SIGKDD Explorations Newsletter, 2(2), 76-80.
  • Sholom M.W., Indurkhya N., Zhang T., Damerau F. (2004), Text Mining: Predictive Methods for Analyzing Unstructured Information, Springer.
  • Tan, A.H., Yu, P.S. (2004), Guest Editorial: Text and Web Mining, Applied Intelligence 18, 239-241, Kluwer Academic Publisher.
  • Unstructured data (2009), http://en.wikipedia.org/wiki/Unstructured_data.
  • W. Fan, L. Wallace, S. Rich, Z. Zhang. (2006), Tapping into the power of text mining, Communications of ACM, 49(9), 76-82.
  • Web Mining for Clementine 12.0 User’s Guide (2007), SPSS Inc.