Veri Madenciliğinde Birliktelik Kuralları ve İkinci El Otomobil Piyasası Üzerine Bir Uygulama

İkinci el piyasada devredilen otomobil sayısı her geçen yıl artmaktadır. Bu durum ikinci el araç piyasasının detaylı birşekilde incelenmesini zorunlu kılmaktadır. Yeni geliştirilen analizler ve yığınla toplanabilen veri setleri yardımıyla ikinci elaraç piyasasının işleyiş mekanizmasına ilişkin faydalı bilgiler ortaya çıkabilmektedir. Çalışmanın amacı, ikinci el araçlarailişkin verilerin bulunduğu bir veri tabanını birliktelik kuralları ile incelemektir. Birliktelik kuralları bir arada gözlenenözelliklerin belirlenmesinde başarıyla kullanılmaktadır. Bu çalışma için, 2016 yılının Temmuz ayında ve Ağustos ayınınilk üç haftasında ikinci el otomobil ilanlarının yer aldığı bir siteden 211109 adet otomobile ait 73 adet değişken webkazıma tekniği ile bir araya getirilmiştir. Birliktelik kurallarının oluşturulabilmesi için veri setinin mantıksal (boolean)değişkenlerden oluşması gerekmektedir. Sayısal değişkenler, dağılımları göz önünde bulundurulmak üzere mantıksalyapıya çevrilmiştir. Çalışmada apriori algoritması ile oluşturulan birliktelik kuralları ağ grafiği yardımı ile görselleştirilmiştir.Çalışma sonunda “dizel araçlar az yakar, fazla hız yapamazlar, torkları yüksektir; yeni ve pahalı araçların vergisiyüksektir” gibi kurallar oluşturulmuştur. Çalışmanın sonuçları ikinci el araç piyasasında işlem yapan taraflar için yolgösterici nitelikte bilgiler içermektedir.

Association Rules in Data Mining and an Application in Second Hand Car Market

Number of road motor vehicles that are handed over are increasing over the years. That makes the detailed examinationof second hand car market is a necessity. It is possible to extract useful information about the operating mechanism ofsecond hand car market using new analysis techniques and massive datasets. The purpose of this study is to examinethe database which includes data belong to second hand cars by association rules. Association rules are successful atdetermining which two objects are observed simultaneously in a dataset. For this study, a dataset includes to 21109second hand cars with 73 variables is scraped from a website in July 2016 and August 2016. In order to apply the apriorialgorithm, the dataset must be consisted from Boolean variables. Numerical variables are converted to Boolean type byusing their distribution. The association rules that are created with apriori algorithm is visualized with a network graph. Atthe end of the study rules such as “diesel cars have less fuel consumption, cannot go much faster, have higher torquevalues; new and expensive cars have higher taxes” are created. The overall results have useful information for thosewho operate in second hand car market.

___

  • Daştan, H. (2016). Türkiye’de İkinci El Otomobil Fiyatlarını Etkileyen Faktörlerin Hedonik Fiyat Modeli İle
  • Belirlenmesi. Gazi Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 18(1), 33-327.
  • Doğan, B., Erol, B., Buldu, A. (2014). Sigortacılık Sektöründe Müşteri İlişkileri Yönetimi için Birliktelik Kurallarının
  • Kullanılması. Marmara Fen Bilimleri Dergisi, 3, 105-114.
  • Doğrul, G., Akay, D., Kurt, M. (2015). Trafik Kazalarının Birliktelik Kuralları ile Analizi. Gazi Mühendislik Bilimleri
  • Ecer, F. (2013). Türkiye’de 2. El Otomobil Fiyatlarını Tahmini ve Fiyat Belirleyicilerinin Tespiti. Anadolu Üniversitesi
  • Erdem, S., Özdağoğlu, G. (2008). Ege Bölgesi’ndeki Bir Araştırma Ve Uygulama Hastanesinin Acil Hasta Verilerinin