Pırlanta fiyat tahmini için regresyon modellerinin karşılaştırmalı analizi

Bilişim dünyasındaki gelişmeler ile artan veri hacmi ve çeşitliliği ile birlikte, hayatımıza büyük veri kavramı girmiş ve beraberinde birçok zorluğu da peşinde getirmiştir. Verinin işlenebilirliği büyük bir önem kazanmış ve güncel kullanılan bazı veri işleme yöntemlerinin performansı yetersiz gelmeye başlamıştır. Büyük veri analizinde yapay zekâ ve makine öğrenmesi teknikleri kullanılarak bu sorunlar çözülmeye çalışılmakta ve gün geçtikçe daha etkin çözümler bulan algoritmalar önerilmeye devam edilmektedir. Bu çalışmanın amacı, iyi bilinen ve sıklıkla kullanılan regresyon algoritmalarını bir veri kümesi üzerinde çalıştırmak, performans sonuçlarını karşılaştırarak en iyi sonuç verenleri sunmaktır. Makalede pırlantaların kesimi, rengi, berraklığı ve fiyatı gibi özellikleri barındıran açık bir veri kümesi kullanılmıştır. Verilerin ön işlemesi yapılmış, tanımlayıcı analiz gerçekleştirilmiş ve fiyatlarının tahmini için farklı regresyon modelleri hem ilkel hem de optimize edilmiş halleriyle çalıştırılmıştır. Regresyon modelleri içinden diğerlerine kıyasla daha düşük RMSE ve daha yüksek r2 değerleri GBM modelleri (özellikle Light GBM) ve rassal orman algoritmasında alınmıştır.

Comparative analysis of regression models for predicting diamond price

With the developments in informatics and the increasing volume and diversity of data, the concept of big data has entered our lives and brought many challenges with it. The usefulness of data has gained great importance and the performance of some commonly used data processing methods have begun to be insufficient. These problems have been tried to be solved by using artificial intelligence and machine learning techniques that find more effective solutions. The aim of this study is to run well-known and frequently used machine learning algorithms on a public dataset, to compare their performance results comparatively, and present the best performant ones. A public data on diamonds is preprocessed, descriptive analysis is performed, and various regression models to predict the corresponding prices are run, both in their primitive and optimized forms, GBM models (especially Light GBM) and random forest algorithm have the lowest RMSE values and highest r2 values compared to other models.

___

  • Kaggle Diamonds Dataset. https://www.kaggle.com /shivam2503/diamonds, Accessed 02 March 2022.
  • G. Sharma, V. Tripathi, M. Mahajan and A. K. Srivastava, Comparative analysis of supervised models for diamond price prediction. Proceedings of 11th International Conference on Cloud Computing, Data Science & Engineering (Confluence), pp. 1019-1022, Uttar Prades, India, 2021.
  • W. Alsuraihi, E. Al-hazmi, K. Bawazeer and H. Alghamdi, Machine learning algorithms for diamond price prediction. Proceedings of 2nd ACM International Conference on Image, Video and Signal Processing (IVSP '20), pp. 150–154, Singapour, 2020.
  • A. C. Pandey, S. Misra and M. Saxena, Gold and diamond price prediction using enhanced ensemble learning. Proceedings of 12th International Conference on Contemporary Computing (IC3), pp. 1-4, Noida, India, 2019.
  • H. Mihir, M. I. Patel, S. Jani and R. Gajjar, Diamond price prediction using machine learning. Proceedings of 2nd IEEE International Conference on Communication, Computing and Industry 4.0 (C2I4), pp. 1-5, Bangalore, India, 2021.
  • N. Monburinon, P. Chertchom, T. Kaewkiriya, S. Rungpheung, S. Buya and P. Boonpou, Prediction of prices for used car by using regression models. Proceedings of 5th International Conference on Business and Industrial Research (ICBIR), pp. 115-119, Thailand, 2018.
  • C. R. Madhuri, G. Anuradha and M. V. Pujitha, House price prediction using regression techniques: A comparative study. Proceedings of International Conference on Smart Structures and Systems (ICSSS), pp. 1-5, Madras, India, 2019.
  • M. C. Satıoğlu, Y. Ar ve B. Tuğrul, Automobile price prediction in Turkey marketplace with linear regression. Proceedings of 5th International Symposium on Multidisciplinary Studies and Innovative Technologies (ISMSIT), pp. 329-333, Turkey, 2021.
  • V. Gupta, K. Singh, S. K. Arjaria and B. Biswas, Dynamic pricing in movie tickets using regression techniques. Proceedings of International Conference on Advanced Computation and Telecommunication (ICACAT), pp. 1-4, India, 2018.
  • G. K. Kumar, D. M. Rani, N. Koppula and S. Ashraf, Prediction of house price using machine learning algorithms. Proceedings of 5th International Conference on Trends in Electronics and Informatics (ICOEI), pp. 1268-1271, India, 2021.
  • G. Yin, F. J. I. Alazzawi, S. Mironov, F. Reegu, A. S. El-Shafay, M. L. Rahman, C. H. Su, Y. Z. Lu and H. C. Nguyen, Machine learning method for simulation of adsorption separation: Comparisons of model’s performance in predicting equilibrium concentrations, Arabian Journal of Chemistry. 15 (3), 103612, 1-10, 2022. https://doi.org/10.1016/j.arabjc.2021.103612.
  • LightGBM, https://www.microsoft.com/en-us/research/project/lightgbm/, Accessed 03 March 2022.
Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi-Cover
  • ISSN: 2564-6605
  • Yayın Aralığı: Yılda 4 Sayı
  • Başlangıç: 2017
  • Yayıncı: Niğde Ömer Halisdemir Üniversitesi