Makine Öğrenmesi ile Nakit Akış Tablosu Üzerinden Kredi Skorlaması: XGBoost Yaklaşımı

Modernleşme ve globalleşmeyle birlikte makine öğrenmesi yöntemleri bankacılık ve finans sektöründe artan bir ivmeyle kullanılmaya başlanmıştır. Özellikle bankacılık sektöründe sunulan kredi ürünlerinin artmasıyla kötü ve iyi müşteriler arasında tam olarak ayırt etme yeteneği son derece önemli hale gelmiştir. Bu ayırt etme yeteneği sadece bankaların karlılıklarını artırmakla kalmaz, aynı zamanda pazardaki rekabet gücünü de arttırır. Bu bağlamda bankalar firmaları borçlandırmadan önce kredi değerlendirme sürecinden geçirirler ve bu sürecin en önemli ayağını da şüphesiz skorlama çalışması oluşturmaktadır. Bankaların taşıdığı en önemli risklerden birinin kredi riski olduğu düşünülürse kredi değerlendirme sürecinde skorkart çalışmasının da doğru, güvenilir ve hızlı bir şekilde sonuçlanmasının önemi yadsınamaz. Skorlama çalışmalarında firmanın solo ya da grup firması olması firmanın ya da firmaların değerlendirilmesini değiştirebilir. Grubu oluşturan firmalarda ana firma statüsündeki firmanın derecelendirme notu ne kadar iyi olursa olsun diğer firmaların notu düşük ise, konsolide derecelendirme notunu etkileyip düşürebilir. Bu kapsamda çalışmada grup firmalarına vurgu yapılmıştır. Çalışmanın amacı konsolide firmaların nakit akış tablosundan faydalanılarak bir skorkart modeli geliştirilmeye çalışılmasıdır. Python program dili makine öğrenmesi ile XGBoost, Gradient Boosting ve Neural Network yöntemleri kullanılmıştır. Bu üç yöntem karşılaştırılmış olup XGBoost yöntemi %80 doğruluk skoru ile tercih edilen model olmuştur.

Credit Scoring on Cash Flow Table with Machine Learning: XGBoost Approach

Machine learning methods have started being used with greater momentum in the banking and finance sectors alongside modernization and globalization. The ability to distinguish between good and bad customers has become extremely important, especially with the increase in credit products offered in the banking sector. This ability to distinguish not only increases banks’ profitability but also increases their competitiveness in the market. In this context, banks put companies through a credit evaluation process before loaning to them, and the most important leg of this process is undoubtedly the credit score analysis. Considering that one of the most important risks banks carry is credit risk, the importance of correctly, reliably, and quickly completing the balanced scorecard study during the credit evaluation process cannot be denied. Whether the company undergoing a scorecard study is an independent company or part of a group of companies may change how the company or firms are evaluated. In a group of companies, no matter how good a rating one company has in regard to its status within the parent company, if the other companies have low ratings, this may affect and reduce the consolidated rating. In this context, the current study focuses on groups of companies. The aim of the study is to try to develop a scorecard model using the cash flow statements of consolidated companies. In this study, eXtreme Gradient Boosting (XGBoost), Gradient Boosting and Artificial Neural Network algorithms which are machine learning techniques and Python program were used. These three methods were compared, and the extreme gradient boosting method was shown to be the preferred model with an accuracy rating of 80%.

___

  • Akdoğan, N., & Tenker, N. (2007). Finansal Tablolar ve Mali Analiz Teknikleri. Ankara: Gazi Kitapevi. google scholar
  • Akpınar, N. (2019). Makine Öğrenmesi Teknikleriyle Kredi Başvuru Skor Kartının Oluşturulması. (Yüksek Lisans Tezi). Yıldız Teknik Üniversitesi, Fen Bilimleri Enstitüsü, İstanbul. google scholar
  • Ampountolas, A., Nde, T.N., Date, P. & Constantinescu, C. (2021). A Machine Learning Approach for Micro-Credit Scoring. Risks Journal, 9 (50), 1-20. google scholar
  • Brown, L. & Mues, C. (2012). An experimental comparison of classification algorithms for imbalanced credit scoring data sets. Expert Systems with Applications, 39, 3446-3453. google scholar
  • Can, Ö., Y. (2020). Makine Öğrenmesi Teknikleri Kullanılarak Kredi Risk Analizi. (Yüksek Lisans Tezi). İstanbul Aydın Üniversitesi, Fen Bilimler Enstitüsü, İstanbul. google scholar
  • Chen, C., Yokoyama, S., Yamashita T., & Kawamura H. (2019). Application of XGBoost to Credit Scoring. Information processing Society Of Japan, 194 (11), 1-8. google scholar
  • Demajo, L., M., Vella, V., & Dingli, A. (2020). Explainable AI For Interpretable Credit Scoring. Computer Science & Information Technology, 185-203. google scholar
  • Fidan, M. M. (2009). Kredilendirme Sürecinde Uluslararası Finansal Raporlama Standartlarına Göre Konsolide Finansal Raporların Düzenlenmesi. (Doktora Tezi). Kadir Has Üniversitesi Sosyal Bilimler Enstitüsü. google scholar
  • Ghodselahi, A., & Amirmadhi, A. (2011). Application Of Artificial Intelligence Techniques For Credit Risk Evaluation. International Journal Of Modeling And Optimization, 1 (3), pp.246. google scholar
  • Girgin, F. (2020). TMS 7 Nakit Akış Tablosu Kapsamında Finansal Performansın Ölçülmesi: Bist’te Bir Uygulama. (Yüksek Lisans Tezi). Balıkesir Üniversitesi Sosyal Bilimler Enstitüsü. google scholar
  • Grogoriou, K. (2021). Credit risk analysis via machine learning methods: client segmentation based on probability of default. (Master Thesis). University Of Macedonia, Master Of Science In Applied Informatics. google scholar
  • Guegan, D., & Hassani, B. (2018). Regulatory learning: How to supervise machine learning models? An application to credit scoring. The Journal of Finance and Data Science, 4, 157-171. google scholar
  • Hild, A. (2021). Estimating And Evaluating The Probability Of Default- A Machine Learning Approach. (Master Thesis). Uppsala Universitet, Statistics İn The Faculty Of Social Sciences. google scholar
  • Li, Y., & Chen, W. (2020). A Comparative Performance Assessment of Ensemble Learning for Credit Scoring. Mathematics, 8 (1756), 1-19. google scholar
  • Nehrebecka, N. (2018). Predicting The Default Risk Of Companies. Comparison Of Credit Scoring Models: Logit Vs Support Vector Machines. Econometrics. Ekonometria Advances in Applied Data Analysis, 22 (2), 54-73. google scholar
  • Qin, C., Zhang, Y., Bao, F., Zhang, C., Liu, P. & Liu, P. (2021). XGBoost Optimized by Adaptive Particle Swarm Optimization for Credit Scoring. Hindawi Mathematical Problems in Engineering, 1-18. google scholar
  • Ramraj, S., Uzir, N., Sunil, R., & Banerjee, S. (2016). Experimenting XGBoost Algorithm for Prediction and Classification of Different Datasets. International Journal of Control Theory and Applications, 9 (40), 1-12. google scholar
  • Salvaire, P. A. J. M. (2019). Explaining The Predictions Of A Boosted Tree Algorithm Applicatıon To Credit Scoring. (Master Thesis). Universidade Nova de Lisboa, NOVA Information Management School. google scholar
  • Sang, H., V., Nam, N., H. & Nhan, N., D. (2016). A Novel Credit Scoring Prediction Model Based On Feature Selection Approach And Parallel Random Forest. Indian Journal Of Science And Technology, 9 (20), 1-6. google scholar
  • Sarker, I. H. (2021), Machine Learning: Algorithms, RealWorld Applications and Research Directions. SN Computer Science, 2 (160), 1-21. google scholar Sorhun, E. (2021). Python ile Makine Öğrenmesi. İstanbul: Abaküs Yayınları. google scholar
  • Terko, A., Zunic, E., Donko, D., & Dzelihodzic, A. (2019). Credit Scoring Model Implementation in A Microfinance Context. International Conference On Information, Communication And Automation Technologies, 1-6. google scholar
  • Ustalı, N., K., Tosun, N., & Tosun, Ö. (2020). Makine Öğrenmesi Teknikleri ile Hisse Senedi Fiyat Tahmini. Eskişehir Osmangazi Üniversitesi İİBF Dergisi, Cilt 16, Sayı 1, 5-8. google scholar
  • Üçoğlu, D., & Fırat, F. Z. (2019). TFRS 10 Konsolide Finansal Tablolar Standardı Kapsamında Grup İçi Satışlarla İlgili Yapılan Eliminasyon İşlemlerinin Ertelenmiş Vergi Etkileri. Muhasebe ve Denetime Bakış, Cilt 57, s.85. google scholar
  • Wang, G., Hao, J., Ma, J. & Jiang, H. (2011). A comparative assessment of ensemble learning for credit scoring. Expert Systems with Applications, 38, 223-230. google scholar Yalçın, Z. (2020). TFRS 10 Standardı Konsolide Finansal Tablolar: Bir Uygulama Örneği. İzmir YMMO Dergisi, 2 (2), s.3. google scholar