Destek Vektör Makineleri ile Yaramaz Elektronik Postaların Filtrelenmesi

Elektronik postanın (e-posta) hızlı ve kolay bir haberleşme aracı olması, insanlar tarafından iletişimde yoğun şekilde kullanılmasına neden olmaktadır. E-postanın bu özellikleri; reklam yapmak, fikirlerini insanlara duyurmak ve çeşitli istismar çalışmaları yapmak isteyen insanlar için bir cazibe merkezi olmasını sağlamaktadır. Bu tür girişimler de bir güvenlik zafiyeti oluşturmaktadır. Temelleri Vladimir N. Vapnik tarafından atılan bir makine öğrenme algoritması olan destek vektör makineleri 1995’den itibaren sınıflandırma ve eğri uydurma problemlerinde başarılı sonuçlar vermiştir. Bu çalışmada, destek vektör makineleri kullanılarak yaramaz (istenmeyen) e-postaların filtrelenmesi işlemi gerçekleştirilmiştir.

Spam e-mail Filtering Using Support Vector Machine

Electronic mail (e-mail) is a communication medium that is fast and easy to use, making people to use it frequently. These features of e-mail cause it to be the center of attraction for the people who want to advertise, share their ideas with others or involve in malicious activities. Thus, these kind of activities create security threats. Support vector machines are machine learning algorithms that are developed by Vladimir N. Vapnik and produce successful results in several application domains such as clustering and curve fitting problem. In this study, we carry out unwanted (spam) e-mail filtering using support vector machine.

___

  • [1] C.Altunyaprak, "Bayes Yöntemi Kullanılarak İstenmeyen Elektronik Postaların Filtrelenmesi", YL Tezi, Bilgisayar Mühendisliği Bilimleri, Muğla Üniversitesi, Muğla, 2006.
  • [2] Ü. Aydoğan, "Destek Vektör Makinalarında Kullanılan Çekirdek Fonksiyonların Sınıflama Performanslarının Karşılaştırılması",YL Tezi, Biyoistatistik Anabilim, Hacettepe Üniversitesi, Dalı, İstanbul, 2010.
  • [3] N. Cristianini and J. S. Taylor, , An Introduction to Support Vector Machines and Other Kernel-Based Learning Methods, Cambridge: Cambridge University Press, 2000 [4] C. Xiao-li , L. Pei-yu , Z. Zhen-fang and Y. Qiu," A method of spam filtering based on weighted support vector machines", IEEE International Symposium on IT in Medicine & Education ITIME '09. 2009, pp. 947- 950
  • [5] (2013, Nisan), A Practical Guide to Support Vector Classification,Available:http://www.csie.nt u.edu.tw/~cjlin/papers/guide/guide.pdf
  • [6] (2013, Nisan), Ling-Spam data set, Available: http://csmining.org/index.php/ling-spamdatasets.html
  • [7] M.R. Islam, M.U. Chowdhury, W. Zhou," An Innovative Spam Filtering Model Based on Support Vector Machine", Computational Intelligence for Modelling, Control and Automation and International Conference on Intelligent Agents, Web Technologies and Internet Commerce, International Conference on 2005, pp. 348- 353.
  • [8] P.N. Tan, M. Steinbach, V. Kumar, Introduction to Data Mining, Pearson Education. Indiana: Addison-Wesley, 2006.
  • [9] S. Tolun, "Destek Vektör Makineleri: Banka Başarısızlığının Tahmini Üzerine Bir Uygulama", Doktora Tezi, İşletme Bölümü, İstanbul Üniversitesi, İstanbul., 2008.
  • [10] Vapnik, V. (1995) The Nature of Statistical Learning Theory, NewYork: SpringerVerlag, 187.
  • [11] J. Zhiyang, L. Weiwei, G. Wei, X. Youming, "Research on Web Spam Detection Based on Support Vector Machine", Communication Systems and Network Technologies (CSNT) 2012, , pp.517- 520.
  • [12] Z. Wang, X. Sun, X. Li, D. Zhang,, "An Efficient SVM-Based Spam Filtering Algorithm", Machine Learning and Cybernetics, International Conference on 2006 , pp. 3682- 3686