Destek Vektör Makineleri Kullanılarak Spam SMS Tespiti

Kısa Mesaj Servisi (SMS) son yılların en önemli iletişim araçlarından biri haline gelmiştir. Mobil cihazların artan popülaritesiyle, SMS kullanım oranları da yıllar içinde daha da artmaya devam edecektir. SMS doğrudan bireylere ulaşmak için kullanılan pratik bir yöntem olarak kullanılmaktadır. Ancak bu pratik ve kolay yöntem, SMS'in yanlış ve kötü amaçlı kullanılmasına da neden olabilmektedir. Şirketlerin reklam veya tanıtım SMS'leri bu yanlış kullanımın önemli bir örneğidir. Bu çalışmada, Destek Vektör Makineleri kullanılarak bir spam SMS tespit tekniği önerilmiştir. Bu çalışmada 747 spam SMS ve 4827 jambon SMS içeren SMSSpamCollection veri kümesi kullanılmıştır. Veri kümesindeki Spam SMS tahminini değerlendirmek için 10 katlı çapraz doğrulama tekniği kullanılmıştır. Önerilen yaklaşımda Destek Vektör Makineleri sınıflandırma algoritması ile %98.33 oranında başarılı tespit yapılarak, 0,087 yanlış pozitif oran elde etmiştir.

Support Vector Machine Based Spam SMS Detection

Short Message Service (SMS) is the most important communication tool in recent decades. With the increased popularity of mobile devices, the usage rate of SMS will increase more and more in years. SMS is a practical method used to reach individuals directly. But this practical and easy method can cause SMS to be misused. The advertising or promotional SMS of the companies are an examples of this misuse. In this study, a spam SMS detection technique is proposed using SVM. SMSSpamCollection dataset, which is contain 747 spam SMS and 4827 ham SMS, is used. 10 fold cross-validation technique is used to evaluate prediction of Spam SMS in the dataset. Therefore, proposed approach achieved 98.33 % true positive rate and 0,087 false positive rate for SVM classification algorithm.

___

  • 1. Choudhary, N., & Jain, A. K., Towards Filtering of SMS Spam Messages Using Machine Learning Based Technique. In Advanced Informatics for Computing Research pp. 18-30, Springer, Singapore, 2017.
  • 2. Mujtaba, G., & Yasin, M., SMS spam detection using simple message content features. J. Basic Appl. Sci. Res, 4(4), 275-279, 2014.
  • 3. El-Alfy, E.S.M., AlHasan, A.A.: Spam filtering framework for multimodal mobile communication based on dendritic cell algorithm. Future Gen. Comput. Syst. 64, 98–107, 2016.
  • 4. Chan, P.P.K., Yang, C., Yeung, D.S., Ng, W.W.Y.: Spam filtering for short messages in adversarial environment. Neurocomputing 155, 167–176, 2015.
  • 5. Xu, Q., Xiang, E.W., Yang, Q., Du, J., Zhong, J.: SMS spam detection using non-content features. IEEE Intell. Syst. 27(6), 44–51, 2012.
  • 6. Yadav, K., Kumaraguru, P., Goyal, A., Gupta, A., Naik, V.: SMSAssassin: crowdsourcing driven mobile-based system for SMS spam filtering. 12th Workshop on Mobile Computing Systems and Applications, pp. 1–6. ACM 2011.
  • 7. Hidalgo, J.M.G., Bringas, G.C., Sánz, E.P., García, F.C.: Content based SMS spam filtering. In ACM Symposium on Document Engineering, pp. 107–114. ACM 2006.
  • 8. G. Chechik, G. Heitz Max-margin Classification of Data with Absent Futures. In Journal of Machine Learning Research 9, 2008.
  • 9. Osowski, S., Siwekand, K., and Markiewicz, T. MLP and SVM Networks – a Comparative Study. Proceedings of the 6th Nordic Signal Processing Symposium – NORSIG, 2004.
  • 10. Almeida, T.A., Gomez Hidalgo, J.M., Yamakami, A. Contributions to the Study of SMS Spam Filtering: New Collection and Results. Proceedings of the 2011 ACM Symposium on Document Engineering (DOCENG'11), Mountain View, CA, USA, 2011.
Politeknik Dergisi-Cover
  • ISSN: 1302-0900
  • Yayın Aralığı: Yılda 4 Sayı
  • Başlangıç: 1998
  • Yayıncı: GAZİ ÜNİVERSİTESİ