Sağlık Harcamalarının Tahmininde Karar Ağacının Kullanımı
Sağlık harcamalarının önceden tahmin edilebilmesi gerek genel bütçe planlamasında gerekse sigortacılık sektöründe hizmet veren kurumların müşterilerine doğru fiyatlandırmayı yapabilmesinde büyük öneme sahiptir. Özellikle sigorta şirketlerinin rekabetçi fiyat teklifleri sunabilmesi ve karlılığını arttırabilmesi için doğru analizler yapması gerekmektedir. Bu çalışmada veri madenciliği yöntemlerinden biri olan karar ağacı kullanılarak sağlık harcaması tahmini yapılmış ve sonuçlar analiz edilmiştir. Açık erişimli Kaggle veri bilimi depolama platformundan alınan veri kümesindeki yaş, cinsiyet, çocuk sayısı, vücut kitle indeksi, sigara kullanma ve bölge bilgileri karar ağacının giriş değerlerini oluşturmaktadır. Sağlık harcaması ise bu değerlere bağlı olarak çıkış değerimizdir. Bu verilerden yaralanarak yapılan tahmin işleminde kullanılan karar ağacı yöntemi üzerinde analizler yapılmıştır. Elde edilen performans sonuçlarının sağlık alanında planlama yapıcılar, sigortacılık alanında hizmet veren kuruluşlar ile bu alanlardaki araştırmacılara yol gösterici olacağı düşünülmektedir.
Utilization of Decision Tree in Prediction of Health Care Costs
Prediction of health care cost has a big importance for general budget planning and accurate pricing of institutions which are in insurance sector. In particular, insurance companies need to make accurate analysis for competitive bidding and for increasing profitability. In this study, decision tree which is one of the data mining methods is used to make prediction of health care cost and results are analyzed. The values age, sex, number of child, bmi, region, smoker which taken from the data set given in open access Kaggle data mining data storage platform is input attributes. Health care cost is the label attribute depends on these attributes. Analysis of the decision tree method was performed in this prediction which is made by using these values. Performance results will hope to be helpful for planners on health budget, the insurance companies and researchers on those areas.
___
- Akpınar, Ö. (2018). Sigorta Sektöründe Veri Madenciliği Ve Kullanım Alanları. Dumlupınar Üniversitesi Sosyal Bilimler Dergisi (57): 103-119.
- Atalan, A. (2018). Türkiye Sağlık Ekonomisi İçin İstatistiksel Çok Amaçlı Optimizasyon Modelinin Uygulanması. İşletme Ekonomi ve Yönetim Araştırmaları Dergisi 1(1): 34-51.
- Berisha, F. (2017). Quality of the predictions: mean absolute error, accuracy and coverage.
- Koyuncugil, A., Özgülbaş, N. (2009). Veri madenciliği: Tıp ve sağlık hizmetlerinde kullanımı ve uygulamaları. Bilişim Teknolojileri Dergisi 2(2): 21-32.
- Okatan, E., Işık, A.H. (2019). Prediction of health expenditure with decision tree method. April 24-27, 2019, Burdur, Turkey, Abstract Book, 500p
- Rokach, L., Maimon, O. Z. (2008). Data Mining With Decision Tree: Theory And Applications. World Scientific Publishing Co. Pte. Ltd, Singapore.
- URL-1. (2018). http://apps.who.int/gho/data/view.main.GHEDCHEGDPSHA2011REGv?lang=en. WHO (World Health Organization) Global Health Observatory Data Repository. (Erişim Tarihi: 10.09.2019)
- URL-2. (2019). https://www.marinedatascience.co/blog/2019/01/07/normalizing-the-rmse/ (Erişim Tarihi: 15.09.2019)
- URL-3. (2018). https://www.kaggle.com/mirichoi0218/insurance (Erişim Tarihi: 15.05.2019).
- Wang, Y., Kung, L., Byrd, T. A. (2018). Big data analytics: Understanding its capabilities and potential benefits for healthcare organizations. Technological Forecasting and Social Change 126: 3-13.
- Wu, D. J., Feng, T., Naehrig, M., Lauter, K. (2016). Privately evaluating decision trees and random forests. Proceedings on Privacy Enhancing Technologies: 2016(4): 335-355.
- Yıldırım, Z., Kekeç, H. M., Polat, A. (2018). Türkiye’de Sağlık Harcamaları Ve Finansmanının Yıllar İtibariyle Analizi. Gazi Üniversitesi Sosyal Bilimler Dergisi 5(14): 550-563.