Borsa endeks hareket yönünün çoklu lojistik regresyon ve k-en yakın komşu algoritması ile tahmini

Hisse senedi piyasası birçok makroekonomik değişkenler ve politik faktörlerden etkilendiği için finansal veri madenciliğinde, hisse senedi endeksi hareket yönü tahmini zor bir sınıflandırma problemidir. Bu problemin doğru tahmini kısa vadeli yatırımcılara erken öneri sistemi olarak hizmet verebileceği için birçok araştırmacının ilgisini çekmektedir. Bu çalışma, sınıflamaya dayalı denetimli makine öğrenmesi algoritmaları yardımı ile Borsa İstanbul 100 (BIST100) endeksinin günlük aşağı veya yukarı hareket yönünü tahmin etmeyi amaçlar. İlgilendiğimiz problem, belirli bir günde BIST100 endeksinin yükseleceğini veya düşeceğini tahmin etmektir. Bu amaç doğrultusunda, BIST100 endeks hareket yönü üzerindeki etkisi istatistiksel olarak anlamlı bulunan bağımsız değişkenler kullanılarak çoklu lojistik regresyon ve K-en yakın komşu algoritması modelleri kurulmuştur. Son olarak, örneklem dışı tahminler borsadaki gerçek hareketlerle karşılaştırılmıştır. Performanslar sadece doğruluk ile değil, diğer istatistiksel metrikler ile de ölçülmüştür. Elde edilen sonuçlara göre, lojistik regresyon analizi verilen zaman dilimi içinde BIST100 verileri üzerinde K-en yakın komşu algoritmasına karşı %81 doğruluk oranı ile daha iyi tahmin performansı elde etmiştir.

Prediction of stock index movement direction with multiple logistic regression and k-nearest neighbors algorithm

In financial data mining, stock index movement direction prediction is a challenging classification problem, since stock index is affected by many economic and political factors. The accurate prediction of this problem is of interest to many researchers as it can serve as an early recommender system for short-term financiers. This study aims to predict daily upward or downward movement direction of Borsa Istanbul 100 (XU100) index with the aid of supervised machine learning algorithms based on classification. Problem we deal with includes whether on a specific day the XU100 index fall into up bucket or fall into down bucket. For this purpose, the multiple logistic regression and K-nearest neighbors algorithm models are fitted using independent variables whose effect on XU100 index movement direction was statistically significant. Lastly, the out-of sample predictions are compared with the actual movements in the stock market. Performances are measured not only with accuracy but also other statistical metrics. According to the results obtained, logistic regression analysis achieves better predict performance with 81% accuracy opposed to K-nearest neighbors algorithm on XU100 data over the given time period.

___

  • [1] Ballings M, Van den Poel D, Hespeels N, Gryp, R. “Evaluating multiple classifiers for stock price direction prediction”. Expert Systems with Applications, 42(20), 7046-7056, 2015.
  • [2] Diler Aİ. “İMKB Ulusal-100 endeksinin yönünün yapay sinir ağları hata geriye yayma yöntemi ile tahmin edilmesi”. İMKB Dergisi, 7(25-26), 65-81, 2003.
  • [3] Huang W, Nakamori Y, Wang SY. “Forecasting stock market movement direction with support vector machine”. Computers & Operations Research, 32(10), 2513-2522, 2005.
  • [4] Kutlu B, Badur B. “Yapay sinir ağları ile borsa endeksi tahmini”. Yönetim, 63, 25-40, 2009.
  • [5] Kara Y, Boyacıoglu MA, Baykan ÖK. “Predicting direction of stock price index movement using artificial neural networks and support vector machines: The sample of the Istanbul Stock Exchange”. Expert Systems with Applications, 38(5), 5311-5319, 2011.
  • [6] Özdemir K, Tolun S, Demirci E. “Endeks getirisi yönünün ikili sınıflandırma yöntemiyle tahmin edilmesi: İMKB 100 endeksi örneği”. Niğde Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 4(2), 45-59, 2011.
  • [7] Dutta A, Bandopadhyay G, Sengupta S. “Prediction of stock performance in Indian stock market using logistic regression”. International Journal of Business and Information, 7(1), 105-136, 2012.
  • [8] Subha MV, Nambi ST. “Classification of stock index movement using k-nearest neighbours (k-nn) algorithm”. WSEAS Transactions on Information Science and Applications, 9(9), 261-270, 2012.
  • [9] Tayyar N, Tekin S. “İMKB-100 endeksinin destek vektör makineleri ile günlük, haftalık ve aylık veriler kullanarak tahmin edilmesi”. Abant İzzet Baysal Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, 13(1), 189-217, 2013.
  • [10] Türkmen AC, Cemgil AT. “An application of deep learning for trade signal prediction in financial markets”. IEEE 2015 23nd Signal Processing and Communications Applications Conference, Malatya, Turkey, 16-19 May 2015.
  • [11] Patel J, Shah S, Thakkar P, Kotecha, K. “Predicting stock and stock price index movement using trend deterministic data preparation and machine learning techniques”. Expert Systems with Applications, 42(1), 259-268, 2015.
  • [12] Gündüz H, Çataltepe Z, Yaslan Y. “Stock market direction prediction using deep neural networks”. IEEE 2017 25th Signal Processing and Communications Applications Conference, Antalya, Turkey, 15-18 May 2017.
  • [13] Yakut E, Gemici E. “Predicting stock return classification through LR, C5.0, CART and SVM methods, and comparing the methods used: an application at BIST in Turkey”. Ege Academic Review, 17(4), 461-479, 2017.
  • [14] Kara, İ, Ecer F. “BİST endeks hareket yönünün tahmininde sınıflandırma yöntemlerinin performanslarının karşılaştırılması”. The Journal of Academic Social Science, 6(83), 514-524, 2018.
  • [15] Oğuz RF, Uygun Y, Aktaş MS, Aykurt İ. “On the use of technical analysis indicators for stock market price movement direction prediction”. IEEE 27th Signal Processing and Communications Applications Conference, Sivas, Turkey, 24-26 April 2019.
  • [16] Livieris IE, Kotsilieris T, Stavroyiannis S, Pintelas P. “Forecasting stock price index movement using a constrained deep neural network training algorithm”. Intelligent Decision Technologies, 14(3), 1-14, 2019.
  • [17] Bontempi G, Taieb SB, Le Borgne YA. Machine Learning Strategies for Time Series Forecasting. 1st ed. Berlin, Germany, Springer, 2012.
  • [18] Fulcher BD, Jones NS. “Highly comparative feature-based time-series classification”. IEEE Transactions on Knowledge and Data Engineering, 26(12), 3026-3037, 2014.
  • [19] Jiao Y, Jakubowicz J. “Predicting stock movement direction with machine learning: an extensive study on S&P 500 stocks”. IEEE 2017 International Conference on Big Data, Boston, USA, 11-14 December 2017.
  • [20] Balaban ME, Kartal E. Veri Madenciliği ve Makine Öğrenmesi. 2. baskı. İstanbul, Türkiye, Çağlayan, 2018.
  • [21] Alpar R. Uygulamalı Çok Değişkenli İstatistiksel Yöntemler. 5. Baskı. Ankara, Türkiye, Detay, 2017.
  • [22] Lantz B. Machine Learning with R: Expert Techniques for Predictive Modeling. 3rd ed. Birmingham, UK, Packt Publishing Ltd. 2019.
  • [23] Hosmer JR, David W, Lemeshow S, Sturdivant RX. Applied Logistic Regression. 3rd ed. New Jersey, USA, John Wiley & Sons, 2013.
  • [24] Tabachnick BG, Fidell LS. Çok Değişkenli İstatistiklerin Kullanımı. 6. baskı. Ankara, Türkiye, Nobel, 2015.
  • [25] Mitchell, TM. Machine Learning. 1st ed. New York, USA, McGraw-Hill, 1997.
  • [26] Han J, Pei J, Kamber M. Data Mining: Concepts and Techniques. 3rd ed. Waltham, USA, Elsevier, 2011.
  • [27] Steinbach M, Tan PN. kNN: k-Nearest Neighbors. Editors: Wu X, Kumar V. The Top Ten Algorithms in Data Mining, 151-162, Boca Raton, FL, USA, CRC Press, 2009.
  • [28] Zhu W, Zeng N, Wang N. “Sensitivity, specificity, accuracy, associated confidence interval and ROC analysis with practical SAS implementations”. NESUG Proceedings: Health Care and Life Sciences, Baltimore, Maryland, 14-17 November 2010.
  • [29] Fawcett T. “An introduction to ROC analysis”. Pattern Recognition Letters, 27(8), 861-874, 2006.
  • [30] Unal, I. “Defining an optimal cut-point value in ROC analysis: an alternative approach”. Computational and Mathematical Methods in Medicine, 2017, 1-14, 2017.
  • [31] Kelly MJ, Dunstan FD, Lloyd K, Fone DL. “Evaluating cutpoints for the MHI-5 and MCS using the GHQ-12: a comparison of five different methods”. BMC Psychiatry, 8(10), 1-9, 2008.
  • [32] Habibzadeh F, Habibzadeh P, Yadollahie M. “On determining the most appropriate test cut-off value: the case of tests with continuous results”. Biochemia Medica, 26(3), 297-307, 2016.
  • [33] Finnet Elektronik Yayıncılık Data İletişim San. Tic. Ltd. Şti. “Finnet Kurumsal Web Sitesi”. https://www.finnet.com.tr (26.10.2017).
Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi-Cover
  • ISSN: 1300-7009
  • Başlangıç: 1995
  • Yayıncı: PAMUKKALE ÜNİVERSİTESİ
Sayıdaki Diğer Makaleler

AC ve MFDC nokta direnç kaynak teknolojilerinin yeni nesil otomotiv çeliklerinin mekanik özelliklerine etkisi

Mehtap HIDIROĞLU, Unal KAHRAMAN, Nizamettin KAHRAMAN

Farklı kesme parametreleriyle işlenmiş 316LVM paslanmaz çelik malzemesinin talaşlı imalat-yüzey bütünlüğü-aşınma direnci arasındaki ilişkinin incelenmesi

Mustafa UÇURUM, Emrah GÜNEŞSU, Tolga Berkay ŞİRİN, Yusuf KAYNAK

Mobilya işletmelerinde ergonomik yeterliliğin temel bileşen analizi (TBA) ile belirlenmesi

Velittin KALINKARA, Kadir ÖZKAYA, Taner DİZEL

Atama kısıtlı tip-1 montaj hattı dengeleme problemi: Bir kısıt programlama modeli yaklaşımı

Mehmet PINARBAŞI, Hacı Mehmet ALAKAŞ

Şekil hafızalı poliüretanın enjeksiyonla kalıplanmasında parça kalitesi

Şükran KATMER, Çetin KARATAŞ

TR83 bölgesinde yenilenebilir enerji kaynaklarının CRITIC tabanlı gri ilişkisel analiz yaklaşımı ile değerlendirilmesi

A. Cansu GÖK KISA

Rastgele ormanlardan kural çıkarmada küme bölüntüleme formülasyonlarının performans analizi

Mert EDALI

Yüksek uzama kabiliyetine sahip elastomer esaslı kompozit malzemelerin yanma özelliklerine karbon siyahı ve alev geciktirici ajanların etkisinin incelenmesi

Hasan KASIM

Elyaf takviye biçiminin polipropilen kompozitlerin kayma özelliklerine etkisinin araştırılması

Abdullah Onur ÖZDEMİR, Regaip MENKUC, Cetin KARATAS

Titreşen diskten girdap halkası kopmalarının deneysel incelenmesi

Fahrettin Gökhan ERGİN