Öznitelik Mühendisliği ile Makine Öğrenmesi Yöntemleri Kullanılarak BIST 100 Endeksi Değişiminin Tahminine Yönelik Bir Yaklaşım

Finansal piyasaların ana çıktısı bir zaman serisi problemidir ve zaman serileri; doğaları gereği gürültülü, durağan olmayan ve kaotik bir yapı sergilemektedirler. Bu karmaşık yapı neticesinde zaman serilerinin gelecekteki davranışlarına ait öngörme süreci araştırmacılar açısından hayli zorlu bir çalışma alanıdır. Bu çalışmada BIST 100 endeksi günlük getiri yönünün tahmin edilmesinde kapsamlı bir öznitelik mühendisliği işlemi uygulanmış ve farklı makine öğrenmesi algoritmaları kullanılarak modellemeler gerçekleştirilmiştir. Modellere girdi olarak alınacak öznitelikler, serinin özetleyici istatistiklerine, örnekleme dağılımının ek karakteristiklerine ve serinin non-linear/komplex yapısını yansıtan gözlenen dinamiklerine bağlı olarak çıkartılmış ve dışsal değişken kullanmadan da sınıflandırma performanslarının oldukça yüksek olduğu gösterilmiştir. Farklı eğitim-test oranları kullanılarak tahminlerin dayanıklılığı araştırılmıştır.

An Approach for Estimating BIST 100 Index Change Using Machine Learning Methods with Feature Engineering

The main output of financial markets is a time series problem and a time series exhibit a noisy, unstable and chaotic structure. As a result of this complex structure, the process of predicting the future behavior of time series is a very challenging field for researchers. In this study, a comprehensive feature engineering process was applied to estimate the daily return direction of the BIST 100 index and models were carried out using different machine learning algorithms. The features to be taken as input to the models were extracted depending on the summary statistics of the series, the additional characteristics of the sampling distribution, and the observed dynamics reflecting the non-linear/complex structure of the series. It was shown that the classification performances are quite high without using exogenous variables. The stability of the classification performances was investigated using different training-test ratios.

___

  • S. Basak, S. Kar, S. Saha, L. Khaidem ve S. R. Dey, “Predicting the direction of stock market prices using tree-based classifiers,” The North American Journal of Economics and Finance, sayı 47, ss. 552-567, 2019.
  • L. Khaidem, S. Saha, S. Basak, S. Kar ve S. Dey, “Predicting the direction of stockmarket prices using random forest,” 2016.
  • S. Alacan, “Makine öğrenmesi ile teknoloji perakende sektöründe ek garanti satış modellemesi,” Yüksek Lisans Tezi, İstatistik Anabilim Dalı, Fen Bilimleri Enstitüsü, Yıldız Teknik Üniversitesi, İstanbul, Türkiye, 2020.
  • G. Dong ve H. Liu, “Feature engineering for machine learning and data analytics,” CRC Press., 2018.
  • H. Gündüz, “Derin öğrenme yöntemleri ile zaman serisi tahmini,” Doktora Tezi, Fen Bilimleri Enstitüsü, İstanbul Teknik Üniversitesi, İstanbul, Türkiye, 2019.
  • B. N. Alkış, “Çoklu lojistik regresyon ve k-en yakın komşu yöntemleri ile bıst100 endeks getiri yönünün tahmini,” Yüksek Lisans Tezi, Fen Bilimleri Enstitüsü, İstanbul Teknik Üniversitesi, İstanbul, Türkiye, 2017.
  • E. Filiz, H. Karaboğa ve S. Akoğul, “Bıst-50 endeksi değişim değerlerinin sınıflandırılmasında makine öğrenmesi yöntemleri ve yapay sinir ağları kullanımı,” Sosyal Bilimler Enstitüsü Dergisi, Çukurova Üniversitesi, Adana, Türkiye, c. 26, sayı 1, ss. 231-241, 2017.
  • K. A. Özdemir, S. Tolun ve E. Demirci, “Endeks getirisi yönünün ikili sınıflandırma yöntemiyle tahmin edilmesi: İMKB 100 endeksi örneği,” İktisadi ve İdari Bilimler Fakültesi Dergisi, Niğde Üniversitesi, Niğde, Türkiye. c. 4, sayı 2, ss. 45-59, 2011.
  • İ. Kara ve F. Ecer, “Bist endeks hareket yönünün tahmininde sınıflandırma yöntemlerinin performanslarının karşılaştırılması,” Akademik Sosyal Araştırmalar Dergisi, 2018.
  • C. Kartal, “Destek vektör makineleri ile borsa endekslerinin tahmini,” Itobiad: Journal of The Human & Social Science Researches, c. 9, sayı 2, ss. 1394-1418, 2020.
  • H. Pabuçcu, “Borsa endeksi hareketlerinin makine öğrenme algoritmaları ile tahmini,” Uluslararası İktisadi ve İdari İncelemeler Dergisi,” c. 23, ss. 179-190, 2019.
  • B. Aksoy, “Pay senedi fiyat yönünün makine öğrenmesi yöntemleri ile tahmini: borsa istanbul örneği,” Business and Economics Research Journal, c. 12 sayı 1, ss. 89-110, 2021.
  • A. Öztekin, R. Kızılaslan, S. Freund ve A. Işeri, “A data analytic approach to forecasting daily stock returns in an emerging marke,” European Journal of Operational Research, c. 253, sayı 3, ss. 697-710, 2016.
  • H. Gunduz ve Z. Cataltepe, “Borsa Istanbul (BIST) daily prediction using financial news and balanced feature selection,” Expert Systems with Applications, c. 42 sayı 22, ss. 9001-9011, 2015.
  • N. Koç-Ustalı, N. Tosun ve Ö. Tosun, “Makine öğrenmesi teknikleri ile hisse senedi fiyat tahmini,” Osmangazi Üniversitesi İktisadi ve İdari Bilimler Dergisi, c. 16, sayı 1, ss. 1-16, Eskişehir, 2021.
  • E. Filiz ve E. Öz, “Classification of BIST 100 ındex changes via machine learning methods,” Marmara Üniversitesi İktisadi ve İdari Bilimler Dergisi, c. 39, sayı 1, ss. 117-129, 2017.
  • Y. Kara, M. A. Boyacıoğlu ve Ö. K. Baykan, “Predicting direction of stock price index movement using artificial neural networks and support vector machines: the sample of the ıstanbul stock exchange,” Expert Systems with Applications, c. 38, sayı 5, ss. 5311-5319, 2011.
  • G. Kemalbay ve B. N. Alkış, “Prediction of stock index movement direction with multiple logistic regression and k-nearest neighbors’ algorithm,” Pamukkale University Journal of Engineering Sciences.
  • Y. Dai ve Y. Zhang, “Machine learning in stock price trend forecasting,” 2013.
  • W. Khan, M. A. Ghazanfar, M. Asam, A. Iqbal, S. Ahmad ve J. A. Khan, “Predıctıng trend ın stock market exchange usıng machıne learnıng classıfıers,” Science International,” c. 28, sayı 2, 2016.
  • X. Di, “Stock trend prediction with technical indicators using svm,” Independent Work Report, Stanford Üniversitesi, 2014. K. Nakagawa, T. Uchida ve T. Aoshima, "Deep Factor Model," ECML PKDD Workshops, ss. 37-50, 2018.
  • Z. Kakushadze ve W. Yu, "Machine learning risk models," Journal of Risk and Control, c. 6, sayı 1, ss. 37-64, 2019. L. Cao ve F. E. Tay, “Financial forecasting using support vector machines,” Neural Computing and Applications, c. 10, sayı 2, ss. 184-192, 2001.
  • K. O. Nti, A. Adekoya ve B. Weyori, “Random forest based feature selection of macroeconomic variables for stock market prediction,” American Journal Of Applied Sciences, 2019.
  • L. A. Teixeira ve A. L. I. De Oliveira, “A method for automatic stock trading combining technical analysis and nearest neighbor classification,” Expert Systems with Applications, c. 37, sayı 10, ss. 6885-6890, 2010.
  • C. Lohrmann ve P. Luukka, “Classification of intraday s&p500 returns with a random forest,” International Journal of Forecasting, c. 35, sayı 1, ss. 390-407, 2019.
  • P. Ou ve H. Wang, “Prediction of stock market index movement by ten data mining techniques,” Modern Applied Science, c. 3, sayı 12, ss. 28-42, 2009.
  • M. Kumar ve M. Thenmozhi, “Forecasting stock index movement: A comparison of support vector machines and random forest,” In Indian Institute of Capital Markets 9th Capital Markets Conference Paper, 2006.
  • W. Huang, Y. Nakamori ve S.Y. Wang, “Forecasting stock market movement direction with support vector machine,” Journal of Computers and Operational Research, ss. 2513-2522, 2005.
  • G. G. Creamer ve Y. Freund, “Predicting performance and quantifying corporate governance risk for latin american adrs and banks,” Financial Engineering and Applications, MIT, Cambridge, 2004.
  • F. Provost ve T. Fawcett, Data science and its relationship to big data and data-driven decision making,” Big Data, c. 1, sayı 1, ss. 51-59, 2013.
  • H. Song, “Autofe: efficient and robust automated feature engineering,” Doctoral Dissertation, Massachusetts Institute of Technology, Massachusetts, 2018.
  • A. Zheng ve A. Casari, “Feature engineering for machine learning: principles and techniques for data scientists,” O'Reilly Media, Inc., 2018.
  • U. Khurana, H. Samulowitz ve D. Turaga, “Feature engineering for predictive modeling using reinforcement learning,” in Proc. AAAI Conference on Artificial Intelligence, c. 32, sayı 1, 2018.
  • S. Khalid, T. Khalil ve S. Nasreen, “A survey of feature selection and feature extraction techniques in machine learning,” Science and İnformation Conference, 2014.
  • I. Nun, P. Protopapas, B. Sim, M. Zhu, R. Dave, N. Castro ve K. Pichara, “Fats: feature analysis for time series,” Arxiv Preprint, 2015.
  • B. Naul, S. Van Der Walt, A. Crellin-Quick, J. S. Bloom ve F. Pérez, “Cesium: open-source platform for time-series inference,” Arxiv Preprint, 2016.
  • M. Christ, N. Braun, J. Neuffer ve A. W. Kempa-Liehr, “Time series feature extraction on basis of scalable hypothesis tests (Tsfresh–a python package),” Neurocomputing, c. 307, ss.72-77, 2018.
  • M. Barandas, D. Folgado, L. Fernandes, S. Santos, M. Abreu, P. Bota ve H. Gamboa, “Tsfel: Time Series Feature Extraction Library,” Softwarex, 2020.
  • Tsfresh Kütüphanesi, [Online], Erişim: https://tsfresh.readthedocs.io/en/latest/text/forecast ing.html, Erişim tarihi: 15 Ocak 2021.
  • Y. Benjamini ve Y. Hochberg, “Controlling the false discovery rate: a practical and powerful approach to multiple testing,” Journal of The Royal Statistical Society Series B, c. 57, sayı 1, ss. 289–300, 1995.
  • W. Dubitzky, O. Wolkenhauer, K. H. Cho ve H. Yokota, “Benjamini–Hochberg Method,” In:(Eds) Encyclopedia of Systems Biology, Springer, New York, [Online], Erişim: https://doi.org/10.1007/978-1-4419-9863-7_1215, Erişim tarihi: 17 Mayıs 2020.
  • S. Glen, "Benjamini-Hochberg Procedure", Springer Link Kütüphanesi, [Online], Erişim: https://www.statisticshowto.com/benjamini-hochberg-proce dure/, Erişim tarihi: 18 Mayıs 2021.
  • N. Şahin, “Yapay sinir ağları ve karar ağaçları modelleri ile işletmelerin finansal başarısızlıklarının tahminlenmesi,” Yüksek Lisans Tezi, Fen Bilimleri Enstitüsü, Yıldız Teknik Üniversitesi, İstanbul, Türkiye, 2019.
  • S. Alp ve E. Öz, Makine Öğrenmesinde Sınıflandırma Yöntemleri ve R Uygulamaları, 1. baskı, Ankara, Türkiye: Nobel Akademik Yayıncılık, 2019.
  • S. Özekeş, “Veri madenciliği modelleri ve uygulama alanları,” İstanbul Ticaret Üniversitesi Dergisi, sayı 3, 2003.
  • L. Breiman, “Random forests machine learning,” Kluwer Academic Publishers, c. 45, sayı 1, ss. 5-32, 2001.
  • S. Elesan, “Veri madenciliğinde farklı karar ağaçları ve k-en yakın komşuluk yöntemlerinin incelenmesi: kadın hastalıkları ve doğum verisinde bir uygulama,” Doktora Tezi, Sağlık Bilimleri Enstitüsü, Van Yüzüncü Yıl Üniversitesi, Van, Türkiye, 2019.
  • P. Cunningham ve S. J. Delanay, “K-neighbour classifiers technical report,” ss. 1-17, 2007.
  • A. Mucherino, P. J. Papajorgji, ve P. M. Pardalos, “K-nearest neighbor classification in data mining in agriculture,” Springer, New York, ss. 83-106, 2009.
  • S. K. Çalışkan, İ. Soğukpınar, “Kxknn: K-means ve k en yakin komşu yöntemleri ile ağlarda nüfuz tespiti,” EMO Yayınları, ss. 120-24, 2008.
  • G. Silahtaroğlu, Veri Madenciliği, İstanbul, Türkiye: Papatya Yayınları, 2008.
  • C.A. Mertler ve R.A Vannatta, Advanced and multivariate statistical methods: Practical application and interpretation, Los Angeles, California, USA: Pyrczak Publishing, 2002.
  • E. Yakut, D. Elmas ve Y. Yavuz, “Yapay sinir ağları ve destek vektör makineleri yöntemleriyle borsa endeksi tahmini,” Süleyman Demirel Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, c. 19, sayı 1, ss. 139-157, 2014.
  • M. A. Hearst, S.T. Dumais, E. Osuna, J. Platt ve B. Scholkopf, “Support vector machines,” IEEE Intelligent Systems and Their Applications, c. 13, sayı 4, ss.18-28, 1998.
  • B. Scholkopf, “The kernel trick for distances,” Advances in Neural Information Processing Systems, 2001, ss. 301-307. C. Demir, “Macroeconomic determinants of stock market fluctuations: the case of BIST 100,” Economies, c. 7, sayı 1, ss. 8, 2019.
  • H. Luo ve S. Wang, “Based on the pca-arıma-bp hybrid model of stock price prediction research,” Anzıam Journal, c. 58, ss. 162-178, 2016.
  • Ö. E. Yiğit, S. Alp ve E. Öz, “Prediction of bist price indices: a comparative study between traditional and deep learning methods. sigma: journal of engineering and natural,” Sciences/Mühendislik ve Fen Bilimleri Dergisi, c. 38, sayı 4, 2020.