DİJİTAL REKLAM VERİLERİNDEN YARARLANARAK POTANSİYEL KONUT ALICILARININ RASTGELE ORMAN YÖNTEMİYLE SINIFLANDIRILMASI

CLASSIFICATION OF POTENTIAL RESIDENTIAL BUYERS BY USING RANDOM FOREST METHOD TAKING ADVANTAGE DIGITAL ADVERTISING DATA

Günümüzde internet ağlarının yaygınlaşması ve internete erişimin bir ihtiyaç haline gelmesi internet sitelerinde ve diğer dijital platformlardaki reklamların kullanılmasını yaygınlaştırmıştır. Dijital reklamcılık olarak adlandırılan bu süreç firmalar, markalar ve diğer kuruluşlar için insanlara ulaşma ve reklam amaçları doğrultusunda hedeflerini gerçekleştirmelerinde gerekli bir reklam aracı olmuştur.  En önemli özelliği ölçülebilir olan dijital reklamcılık, firmalara çok geniş veriler (istatistikler) sağlamaktadır. Firmalar bu verileri kullanıp dijital reklamların değerlendirmesini yaparak gelecek reklam planları için ön görüye sahip olurlar. Bu çalışmanın amacı bir inşaat firmasının dijital reklam kampanyasından elde edilen kullanıcı verilerini kullanarak bir sınıflandırma yapmaktır.  Kullanıcıların satış ofisine gelip gelmediklerinin kaydının tutulduğu veriler analiz edilerek bir sınıflandırıcı oluşturulmuştur. Bundan sonraki süreçte reklamlarla elde edilen kullanıcı verileri bu sınıflandırıcı kullanılarak sınıflandırılabilir. Böylece kullanıcıların satış ofisine gelip gelmemeleriyle ilgili bir ön bilgi elde edilir. Firma bu ön bilgi sayesinde satış ve pazarlama hedeflerini daha doğru bir şekilde belirleyebilir. Çalışmanın amacı doğrultusunda bağımlı değişken olarak kullanıcıların satış ofisine gelip gelmemesi, bağımsız değişken olarak ise dijital reklamlar sayesinde kullanıcın iletişim bilgilerini hangi gün firma çalışanlarına gönderdiği, kullanıcının cinsiyeti, reklamı hangi sitede görüp siteye geldiği, reklamı hangi reklam alanında (doğal, 300*250 görsel boyutlu vb.) gördüğü, hangi cihazdan (bilgisayar veya telefon) gördüğü, kullanıcının daha önce ilgili firmada kayıtlı olup olmaması ve bu formu hangi amaçla doldurduğu (yatırım, ev sahibi olma vb.) olmak üzere toplamda 7 adet bağımsız değişken kullanılmıştır. Uygulamada R programından yararlanılmış  ve verileri analiz etmek için bir topluluk öğrenme algoritması olan Rastgele Orman Yöntemi kullanılmıştır. Temelinde karar ağaçları olan bu yöntem diğer sınıflandırma algoritmalarına göre daha iyi sonuçlar vermiştir.

___

  • Bauer, E. ve Kohavi, R. (1999). An Empirical Comparison of Voting Classification Algorithms : Bagging , Boosting , and Variants. Machine Learning, 36: 105–139.
  • Breiman, L. (1996). Bagging Predictors. Machine Learning, 24: 123–140.
  • Breiman, L. (1999). Random Forests - Random Features, Tecnical Report 567, Statistic Department, University of California, Berkeley, 1–29. (https://www.stat.berkeley.edu/~breiman/random-forests.pdf, erişim tarihi:08.10.2018).
  • Breiman, L. (2001). Random forests. Machine Learning, 45(1): 5–32. https://doi.org/10.1023/A:1010933404324
  • Chen, C., Liaw, A. ve Breiman, L. (1999). Using Random Forest to Learn Imbalanced Data, 1–12.
  • Cohen, J. (1960). A coefficient of agreement for nominal scales, Educational and Psychological Measurement 20(1): 37-46
  • Han, J., Kamber, M. ve Pei, J. (2012). Data Mining Concepts and Techniques Third Edition. Simon Fraser University: Morgan Kaufman Publıshers.
  • Ho, T. K. (1998). The Random Subspace Method for Constructing Decision Forests, IEEE Trans. Pattern Anal. Mach. Intell. 20: 832-844.
  • James, G., Witen, D., Hastie, T. ve Tibshirani, R. (2014). An Introduction to Statistical Learning with Applications in R,. Performance Evaluation, 64. https://doi.org/10.1016/j.peva.2007.06.006
  • Liaw,A. ve Wiener, M. (2002). Classification and Regression by randomForest. R News 2(3),18-22.
  • Mingers, J. (1989). An empirical comparison of selection measures for decision tree induction. Machine Learning, 3: 319–342. https://doi.org/10.1007/BF00116837
  • Polikar, R. (2006). Ensemble based systems in decision making. IEEE Circuits and Systems Magazine, 6(3): 21–44. https://doi.org/10.1109/MCAS.2006.1688199.
  • R Core Team (2017). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria, URL http://www.R-project.org/.
  • Rokach, L. ve Maimon, O. (2014). Data Mining With Decision Tree Theory and Applications, 2.Edition, World Scientific Publishing.
  • Skurichina, M. ve Duin, R. P. W. (2002). Bagging, boosting and the random subspace method for linear classifiers. Pattern Analysis and Applications, 5(2), 121–135. https://doi.org/10.1007/s100440200011.
  • Uzbaş, B.(2017), Sayısal Dental Modellerden Otomatik Cinsiyet Tespiti, Konya (Doktora Tezi).
  • Yürekli,K..(2016). Dijital Reklamcılıkta Reklam Ajansı - Reklam Veren İlişkisinin Analizi, İstanbul, (Yüksek Lisans Tezi)