Web Sitelerinde Gerçekleştirilen Oltalama SaldırılarınınYapay Zekâ Yaklaşımı ile Tespiti

Oltalama, kişisel bilgilerin internet üzerinden çalınmasına yönelik gerçekleştirilen yazılım tabanlı saldırılardır. Oltalama saldırılarında genellikle kişilerin kimlik bilgileri, kullanıcı parolaları, kredi veya banka kartı bilgileri gibi özel bilgilerin ele geçirilmesi amaçlanır. Bunun için en uygun ortam olarak genelde özel yazılım kodları içeren web sitesi uygulamaları veya elektronik posta sistemleri tercih edilir. Bu tür net uygulamalarında gelen cezbedici görsel veya metin tabanlı iletiler bireyleri yemleyerek saldırıların gerçekleştirilmesini sağlar. Milyarlarca insanın etkileşim içerisinde olduğu internet ortamında bu tür saldırıların önlemini zamanında alabilmek için teknolojik gelişmelerle paralel hareket etmek gerekir. Son zamanlarda, yapay zekâ teknolojileri internet güvenliği alanında adını duyurmayı başarmıştır. Bu çalışmada, makine öğrenme yöntemleri ile 11 binin üzerinde web sitesi incelenmiş ve oltalama saldırısı yapan web siteleri tespit edildi. Veri seti, 30 web parametresinden oluşmaktadır ve açık erişimlidir. Makine öğrenmesi yöntemleri ile her bir web sitesi için 30 özellik incelendi; oltalama saldırısını gerçekleştiren web siteleri ile gerçekleştirmeyen web siteleri sınıflandırıldı. Sonuç olarak, en iyi test doğruluk başarısı Rastgele Orman yöntemi ile %96,53 oranında gerçekleştirildi.

Detection of Phishing Attacks on Websites Using Artificial Intelligence Approach

Phishing is software-based attacks on the stealing of personal information over the internet. In phishing attacks, it is generally aimed to capture private information such as personal identification information, user passwords, credit or debit card information. Website applications or electronic mail systems containing special software codes are generally preferred as the most suitable medium for this. In this kind of net applications, attractive visual or text based messages feed individuals and enable attacks. It is necessary to act in parallel with the technological developments in order to prevent such attacks on time in the internet environment where billions of people interact. Recently, artificial intelligence technologies have managed to make a name in the field of internet security. In this study, over 11 thousand websites were analyzed with machine learning methods and websites that made phishing attacks were determined. The dataset consists of 30 web parameters and is open access. With machine learning methods, 30 features were examined for each website; web sites that carry out the phishing attack and those that did not. As a result, the best test accuracy achievement was realized by Random Forest method at 96.53%.

___

  • [1] Önal H. 2021. Phishing (Oltalama) Saldırısı Nedir? | BGA Security. In: BGA Secur. https://www.bgasecurity.com/2019/09/phishing-oltalama-saldirisi-nedir/. (Erişim: 10 Haziran 2021).
  • [2] Wei B., Hamad R.A., Yang L., vd. 2019. A Deep-Learning-Driven Light-Weight Phishing Detection Sensor. Sensors (Basel), 19 :4258
  • [3] Phishing Statistics: The 29 Latest Phishing Stats to Know in 2020 - Hashed Out by The SSL StoreTM. In: Hashedout. https://www.thesslstore.com/blog/phishing-statistics-latest-phishingstats-to-know/. (Erişim: 19 Haziran 2021).
  • [4] Abdelhamid M. 2020. The Role of Health Concerns in Phishing Susceptibility: Survey Design Study. J Med Internet Res 22:e18394.
  • [5] Yi P., Guan Y., Zou F., vd. 2018. Web phishing detection using a deep learning framework. Wirel Commun Mob. Comput., 4678746.
  • [6] Kaytan M., Hanbay D. 2017. Effective classification of phishing web pages based on new rules by using extreme learning machines. Anatol J Comput Sci, 2:15–36.
  • [7] Sonowal G. 2020. Phishing email detection based on binary search feature selection. SN Comput Sci, 1:191.
  • [8] Chand E. 2021. Phishing website Detector. In: Kaggle. https://www.kaggle.com/eswarchandt/phishing-website-detector. (Erişim: 7 Haziran 2021).
  • [9] Huang S., Cai N., Pacheco P.P., vd. 2017. Applications of support vector machine (SVM) learning in cancer genomics. Cancer Genomics Proteomics, 15: 41–51.
  • [10] Sertkaya M.E., Ergen B., Togacar M. 2019. Diagnosis of Eye Retinal Diseases Based on Convolutional Neural Networks Using Optical Coherence Images. In: 2019 23rd International Conference Electronics, 1–5.
  • [11] Erdoğmuş P., Çolak B., Durdağ Z. 2016. K-Means algoritması ile otomatik kümeleme. El-Cezeri J. Sci. Eng. 3:0.
  • [12] Moghtadaiee V., Dempster A.G. 2015. Determining the best vector distance measure for use in location fingerprinting. Pervasive Mob Comput, 23: 59–79.
  • [13] Topîrceanu A., Grosseck G. 2017. Decision tree learning used for the classification of student archetypes in online courses. Procedia Comput Sci, 112: 51–60.
  • [14] Bulut F. 2017. Different mathematical models for entropy in ınformation theory. Bilgi Kuramı ndaki Entropi Kavramıyla İlgili Farklı Matematiksel Modeller, 1: 167–174.
  • [15] Seifert S. 2020. Application of random forest based approaches to surface-enhanced Raman scattering data. Sci Rep 10:5436.
  • [16] Aldrich C. 2020. Process variable importance analysis by use of random forests in a shapley regression framework. Minerals, 10: 1–17.
  • [17] Khan S.A. 2020. Phishing Websites Classification using Deep Learning. In: GitHub. https://github.com/sohailahmedkhan173/Phishing-Websites-Classification-using-DeepLearning. (Erişim: 9 Haziran 2021).
  • [18] Google Colab Notebooks- Colaboratory. In: Google. https://colab.research.google.com/notebooks/intro.ipynb. (Erişim: 9 Haziran 2021).
  • [19] Tumen V., Yildirim O., Ergen B. 2018. Recognition of road type and quality for advanced driver assistance systems with deep learning. Elektron ir Elektrotechnika, 24 :67–74.
  • [20] Tümen V., Ergen B. 2020. Intersections and crosswalk detection using deep learning and image processing techniques. Physica A: Statistical Mechanics and its Applications, 543: 123510.
  • [21] Sahingoz Ö.K., Buber E., Demir Ö., Diri B. 2019. Machine learning based phishing detection from URLs. Expert Systems with Applications, 117: 345–357.
  • [22] Koşan M.A., Yıldız O., Karacan H. 2018. Comparative analysis of machine learning algorithms in detection of phishing websites. Pamukkale University Journal of Engineering Sciences 24 (2): 276–282.
  • [23] Lin T., Capecci D.E., Ellis D.M., vd. 2019. Susceptibility to spear-phishing emails: effects of internet user demographics and email content. ACM Trans Comput Hum Interact, 26: 32.