LR, C5.0, CART, DVM Yöntemlerini Kullanarak Hisse Senedi Getiri Sınıflandırma Tahmini Yapılması ve Kullanılan Yöntemlerin Karşılaştırılması: Türkiye’de BIST’de Bir Uygulama
Hisse senedi getiri sınıflandırma tahmini her zaman için yatırımcıların ve analizcilerin ilgisini çeken bir araştırma alanı olmuştur. Bu çalışmada BİST 100 endeksinde işlem gören kimya, kauçuk ve plastik ürünleri imalatı sanayinde yer alan, faaliyetleri 20092014 yılları arasında süreklilik gösteren 18 şirketin hisse senedi getirilerinde etkili olan faktörler belirlenerek, hisse senedi getirileri tahmin edilmeye çalışılmıştır. Söz konusu verilerin veri madenciliği yöntemlerinden olan LR analiz, C5.0 algoritması, CART algoritması ve DVM yöntemleri kullanılarak analiz işlemleri gerçekleştirilmiş, hisse senedi getiri sınıflandırma tahmininde anlamlı ve faydalı bilgileri ortaya çıkarmak için karar ağacına ait kurallar elde edilmiştir. Yapılan analizler sonucunda LR analizi %75, C5.0 algoritması %88, CART algoritması %89,8 ve DVM analizi %75,9’luk doğru sınıflandırma başarısı gerçekleştirmiştir. Pozitif ve negatif hisse senedi getiri sınıflandırma tahminine etki eden en önemli değişkenlerin “piyasa/defter değeri değişkeni”, “TÜFE değişkeni” ve “brüt kar marjı değişkeni” olduğu saptanmıştır. Yatırımcılar ve analizciler için önerdiğimiz modelin değişkenleri ile birlikte hisse senedi getiri tahmininde kullanılmasının uygun olabileceği gözlenmiştir
Predicting Stock Return Classification through LR, C5.0, CART and SVM methods, and Comparing the Methods Used: An Application at BIST in Turkey
Predicting stock return classification is a research field that has always attracted the attention of investors and analysts. In this study, the factors that affected the stock returns were determined for 18 companies which were dealt at BIST 100 index, and operating to manufacture chemistry, rubber and plastic products, and were active between 2009 and 2014, after which their stock returns were predicted. Of all the data mining methods, relevant data were collected, and analyzed through LR analysis, C5.0 algorithm, CART algorithm and SVM methods. Accordingly, some rules were obtained out of the decision tree in order to reveal significant and beneficial information for predicting the stock return classification. As a result of the analyses, LR analysis showed 75% of success, C5.0 algorithm showed 88% of success, CART algorithm showed 89.8% of success, and SVM analysis showed 75.9% of success for accurate classification. It was determined that the most important variables influencing positive and negative predictions of the stock return classification were ‘market/book value variable’, ‘CPI variable’ and ‘gross profit margin variable’. Using the studied model and its variables for predicting stock return classification was observed to be convenient and was suggested for investors and analysts
___
- Abe, S. (2005) Support Vector Machines For Pattern
Classification. London, Springer.
- Akcan, A. ve Kartal, C. (2011) “İMKB Sigorta Endeksini
Oluşturan Şirketlerin Hisse Senedi Fiyatlarının Yapay
Sinir Ağları İle Tahmini”Muhasebe ve Finansman
Dergisi, 27-40.
- Akpınar, H. (2014) Data Veri Madenciliği Veri Analizi,
Papatya Yayıncılık, İstanbul.
- Alpar, R. (2013) Çok Değişkenli İstatistiksel Yöntemler,
4. Baskı. Ankara, Detay Yayıncılık.
- Alpaydın, E. (2011) Yapay Öğrenme, İstanbul, Boğaziçi
Üniversitesi Yayınevi.
- Altay, E. ve Satman, M. H. (2005) “Stock Market
Forecasting: Artificial Neural Network And Linear
Regression Comparison In An Emerging Market”
Journal of Financial Management & Analysis, 18(2).
- Atan, M., Atan, S. ve Özdemir, Z. A. (2009) “Hisse
Senedi Piyasasında Zayıf Formda Etkinlik: İMKB
Üzerine Ampirik Bir Çalışma”Dokuz Eylül Üniversitesi
İktisadi ve İdari Bilimler Fakültesi Dergisi, 24(2), 33-48.
- Avcı, E. (2009) “Stock Return Forecasts With Artificial
Neural Network Models” Marmara Üniversitesi İ.İ.B.F
Dergisi, 26(1), 443-461.
- Avcı, E. ve Çinko, M. (2008) “Endeks Getirilerinin Yapay
Sinir Ağları Modelleri İle Tahmin Edilmesi: Gelişmekte
Olan Avrupa Borsaları Uygulaması” İktisat İşletme ve
Finans, 137-114 ,)266(23.
- Ayhan, S. ve Erdoğmuş, Ş. (2014) “Destek Vektör
Makineleriyle Sınıflandırma Problemlerinin Çözümü
İçin Çekirdek Fonksiyonu Seçimi” Eskişehir Osmangazi
Üniversitesi İİBF Dergisi, 9(1), 175-198.
- Barak, S. ve Modarres, M. (2015) “Developing an
approach to evaluate stocks by forecasting effective
features with data mining methods” Expert Systems
with Applications, 42(3), 1325-1339.
- Bekçioğlu, S. ve Ada, E. (1985) “Menkul Kıymetler
Piyasası Etkin mi?” Muhasebe Enstitüsü Dergisi, Sayı 41.
- Bekçioğlu, S., Öztürk, M. ve Doğanlı, B. (2004) “Türk
Hisse Senedi Piyasasının Zayıf Şekilde Etkinliğinin Test
Edilmesi” Muhasebe ve Finansman Dergisi, 22: s.39-48.
- Berry, M.J. ve Linoff, G.S. (2004) Data mining
techniques: for marketing, sales and customer
relationship management, John Wiley & Sons.
- Buguk, C. Ve Brorsen, B. (2003) “Testing weak-form
market efficiency: Evidence from the Istanbul
Stock Exchange”International Review of Financial
Analysis, 12(5), 579-590.
- Burges, C. J. C. (1998) A Tutorial on Support Vector
Machines for Pattern Recognition, Data Mining and
Knowledge Discovery: Boston, USA: Kluwer Academic
Publishers.
- Campbell, C. ve Ying, Y. (2011) Learning with support
vector machines. Synthesis Lectures on Artificial
Intelligence and Machine Learning. San Rafael:
Morgan & Claypool Publishers.
LR, C5.0, CART, DVM Yöntemlerini Kullanarak Hisse Senedi Getiri Sınıflandırma Tahmini Yapılması ve
Kullanılan Yöntemlerin Karşılaştırılması: Türkiye’de BIST’de Bir Uygulama
477
- Cao, Q., Parry, M. E., ve Leggio, K. B. (2011) “The threefactor
model and artificial neural networks: predicting
stock price movement in China” Annals of Operations
Research, 185(1), 25-44.
- Chang, P. C., Fan, C. Y., ve Lin, J. L. (2011) “Trend
discovery in financial time series data using a case
based fuzzy decision tree” Expert Systems with
Applications, 38(5), 6070-6080.
- Chang, T. S. (2011). “A comparative study of artificial
neural networks, and decision trees for digital game
content stocks price prediction” Expert Systems with
Applications, 38(12), 14846-14851.
- Cheng, J. H., Chen, H. P., ve Lin, Y. M. (2010) “A
hybrid forecast marketing timing model based on
probabilistic neural network, rough set and C4.
5” Expert systems with Applications, 37(3), 1814-1820.
- Çokluk, Ö., Şekercioğlu, G., ve Büyüköztürk, Ş. (2012)
Sosyal Bilimler İçin Çok Değişkenli İstatistik SPSS ve
Lisrel Uygulamaları, Pegem Akademi, Ankara.
- Dayı, F. ve Ata, H.A. (2012) Yapay Sinir Ağı ile Hisse
Senedi Getirisi Tahmini: Bir Firma Uygulaması, 16.
Finans Sempozyumu, 10-13 Ekim 2012, Erzurum, 181-
194.
- de Oliveira, F. A., Nobre, C. N.,ve Zarate, L. E. (2013)
“Applying Artificial Neural Networks to prediction
of stock price and improvement of the directional
prediction index–Case study of PETR4, Petrobras,
Brazil” Expert Systems with Applications, 40(18), 7596-
7606.
- Dutta, A., Bandopadhyay, G., ve Sengupta, S. (2012)
“Prediction of Stock Performance in the Indian Stock
Market Using Logistic Regression” International
Journal of Business & Information, 7(1).
- Ege, İ. ve Bayrakdaroğlu, A. (2009) “İMKB Şirketlerinin
Hisse Senedi Getiri Başarılarının Lojistik Regresyon
Tekniği İle Analizi”ZKÜ Sosyal Bilimler Dergisi, Cilt 5,
Sayı 10, ss. 139–158.
- Eken, H. ve Adalı, S. (2008). Piyasa Etkinliği ve İMKB:
Zayıf Formda Etkinliğe İlişkin Ekonometrik Bir Analiz.
Muhasebe ve Finansman Dergisi, (37).
- Elton Edwin J. ve Martin J. Gruber (1981) Modern
Portfolio Theory, Second Edition, John Wiley & Sons.
- Enke, D. ve Thawornwong, S. (2005). The use of
data mining and neural networks for forecasting
stock market returns. Expert Systems with
applications, 29(4), 927-940.
- Ergül, N. (2009) “Ulusal Hisse Senedi Piyasasında
Etkinlik” Yönetim Bilimleri Dergisi (7:1 Journal of
Administrative Sciences, ss.101-117.
- Fama, E. F. (1970) “Efficient capital markets: A
review of theory and empirical work” The Journal of
Finance, 25(2), 383-417.
- Field, A. (2005) Discovering statistics using SPSS, 2rd
Edition, London, Sage Publications.
- Grabczewski, K. (2014) Meta-learning in decision tree
induction. Springer.
- Hair, J.F., Black, W.C., Babin, B., Anderson, R.E., ve
Tatham, R.L. (2010) Multivariate data analysis, Seventh
Edition, Pearson Prentice Hall Publishing, New Jersey.
- Hamel, L.H. (2009) Knowledge Discovery with Support
Vector Machines. New Jersey: Wiley Publication.
- Han, J. ve Kamber, M. (2006) Data Mining: Concepts
and Techniques, The Morgan Kaufmann.
- Hargreaves, C. ve Hao, Y. (2013) “Prediction of Stock
Performance Using Analytical Techniques” Journal of
Emerging Technologies in web Intelligence, Vol.5., No.,2,
136-142.
- Haykin S. (1999) Neural Networks: A Comprehensive
Foundation [Elektronik Sürüm], Prentice Hall Inc, New
Jersey.
- Hosmer, D.W. ve Lemeshow, S. (2000) Applied Lojistic
Regression, Second Edition, A Wiley-Interscience
Publication, New York.
- Huang, C.J., Yang, D.X., ve Chuang, Y.T. (2008)
Application of Wrapper Approach And Composite
Classifier To Stock Trend Prediction, Expert Systems
with Applications, 34(4), 2870-2878.
- Ince, H. Ve Trafalis, T. B. (2008) “Short term forecasting
with support vector machines and application to
stock price prediction” International Journal of General
Systems, 37(6), 677-687.
- Kahraman, D. ve Erkan, M. (2005) “İstanbul Menkul
Kıymetler Borsası’nda Tesadüfi Yürüyüş Testi”
Celal Bayar Üniversitesi, İİBF, Yönetim ve Ekonomi
Dergisi, 12(1), 11-24.
- Kalaycı, Ş. (2008) SPSS Uygulamalı Çok Değişkenli
İstatistik Teknikleri, 3.Baskı, Ankara, Asil Yayın.
- Kara, Y., Boyacioglu, M. A., ve Baykan, Ö. K. (2011)
“Predicting direction of stock price index movement
using artificial neural networks and support
vector machines: The sample of the Istanbul Stock
Exchange” Expert systems with Applications, 38(5),
5311-5319.
- Kıyılar, M. (1997) Etkin pazar kuramı ve etkin pazar
kuramının İMKB’de irdelenmesi: test edilmesi.
Sermaye Piyasası Kurulu, Ankara.
- Lai, R. K., Fan, C. Y., Huang, W. H., ve Chang, P. C. (2009)
“Evolving and clustering fuzzy decision tree for
Emre YAKUT, Eray GEMİCİ
478
financial time series data forecasting” Expert Systems
with Applications, 36(2), 3761-3773.
- Lam, M. (2004) “Neural network techniques for
financial performance prediction: integrating
fundamental and technical analysis”Decision Support
Systems, 37(4), 567-581.
- Larose, D.T., ve Larose, C.D. (2014) Discovering
Knowledge In Data An Introduction To Data Mining,
New Jersey: John Wiley & Sons.
- Lu, C. L. ve Chen, T. C. (2009) “A study of applying data
mining approach to the information disclosure for
Taiwan’s stock market investors” Expert Systems with
Applications, 36(2), 3536-3542.
- Menard, S. (2002) Applied Lojistic Regression Analysis,
Second Edition, Sage Publication, London.
- Mertler, C.A. ve Vannatta, R.A. (2005) Advanced and
Multivariate Statistical Methods: Practical Application
and Interpretation, CA: Pyrczak Publishing.
- O’Connell, A.A. (2006) Logistic Regression Models for
Ordinal Response Variables. Thousand Oaks, Sage
Publications, London.
- Ou, P. ve Wang, H. (2009) “Prediction of stock market
index movement by ten data mining techniques”
Modern Applied Science, 3(12), 28–42.
- Öğüt, H., Doğanay, M. M., ve Aktaş, R. (2009) “Detecting
stock-price manipulation in an emerging market: The
case of Turkey” Expert Systems with Applications, 36(9),
11944-11949.
- Öz, B., Ayrıçay, Y., ve Kalkan, G. (2011) “Finansal
Oranlarla Hisse Senedi Getirilerinin Tahmini: İMKB 30
Endeksi Hisse Senetleri Üzerine Diskriminant Analizi
İle Bir Uygulama” Anadolu Üniversitesi Sosyal Bilimler
Dergisi, 11(3), 51-64.
- Özdamar, K. (2004) Paket Programlar İle İstatiksel Veri
Analizi. Genişletilmiş 5.Baskı. Eskişehir, Kaan Kitabevi.
- Özdemir, A. K., Tolun, S., ve Demirci, E. (2011) “Endeks
Getirisi Yönünün İkili Sınıflandırma Yöntemiyle
Tahmin Edilmesi: İMKB-100 Endeksi Örneği” Niğde
Üniversitesi İİBF Dergisi, 4 (2), 45-59.
- Özkan, Y. (2008) Veri Madenciliği Yöntemleri, Papatya
Yayıncılık, İstanbul.
- Panda, C., ve Narasimhan, V. (2006) “Predicting
Stock Returns An Experiment of the Artificial Neural
Network in Indian Stock Market” South Asia Economic
Journal, 7(2), 205-218.
- Patel, J., Shah, S., Thakkar, P., ve Kotecha, K. (2015)
“Predicting stock and stock price index movement
using trend deterministic data preparation and
machine learning techniques” Expert Systems with
Applications, 42(1), 259-268.
- Ren, N., Zargham, M., ve Rahimi, S. (2006) “A decision
tree-based classification approach to rule extraction
for security analysis” International Journal of
Information Technology & Decision Making, 5(01), 227-
240.
- Quinlan, J.R. (1993) C4.5: Programs for Machine
Learning, Morgan Kaufmann Publishers Inc. San
Francisco, CA, USA.
- Quinlan, J.R. (1996) “Improved use of continuous
attributes in C4.5” Journal of Artificial Intelligence
Research, 4:77-90.
- Scholkopf, B. ve Smola A.J. (2002) Learning with
Kernels, Cambridge: MIT Press.
- Sevim, Ş., Yıldız, B., ve Akkoç, S. (1997) “Aşırı Tepki
Verme Hipotezi ve İMKB Üzerine Ampirik Bir Çalışma”
UMKB Dergisi, Cilt 9 Sayı 35, ss.23-39.
- Seyrek, İ.H., ve Ata, H. A. (2010) “Veri Zarflama Analizi
ve Veri Madenciliği ile Mevduat Bankalarında Etkinlik
Ölçümü”, BDDK Bankacılık ve Finansal Piyasalar
Dergisi, Cilt 4, Sayı:2, ss 67-84.
- Shahnaz, F. (2006) Decision Tree Based Algorithms,
Michael W. Berry (Ed.), Lecture Notes in Data Mining,
USA: World Scientific Publisher.
- Tayyar, N. ve Tekin, S. (2013) “IMKB 100 Endeksinin
Destek Vektör Makineleri ile Günlük, Haftalık ve Aylık
Veriler Kullanarak Tahmin Edilmesi” Abant İzzet Baysal
Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, 13(1), 189-
218.
- Tektaş, A., ve Karataş, A. (2004) “Yapay Sinir Ağları
ve Finans Alanına Uygulanması: Hisse Senedi Fiyat
Tahminlemesi. Atatürk Üniversitesi İktisadi ve İdari
Bilimler Dergisi, 337-349 ,)4-3( 18.
- Thawornwong S. ve Enke, D. (2004) “The adaptive
selection of financial and economic variables for use
with artificial neural networks” Neurocomputing, 56,
205–232.
- Toraman, C. (2008) “Demir-Çelik Sektöründe Yapay
Sinir Ağları İle Hisse Senedi Fiyat Tahmini: Erdemir
A.Ş. ve Kardemir A.Ş. Üzerine Bir Tahmin Uygulaması”
Muhasebe ve Finansman Dergisi, Sayı:39, s.44-57.
- Tsai, C. F. ve Hsiao, Y. C. (2010) “Combining multiple
feature selection methods for stock prediction: Union,
intersection, and multi-intersection approaches”
Decision Support Systems, 269-258 ,)1(50.
- Tsai, C. F., Lu, Y. H., ve Yen, D. C. (2012) “Determinants
of intangible assets value: The data mining
approach”Knowledge-Based Systems, 31, 67-77.
- Tsai, C.F., Lin, Y.C., Yen, D. C., ve Chen, Y.M. (2011)
“Predicting stock returns by classifier ensembles”
Applied Soft Computing, 11, 2452–2459.
- LR, C5.0, CART, DVM Yöntemlerini Kullanarak Hisse Senedi Getiri Sınıflandırma Tahmini Yapılması ve
Kullanılan Yöntemlerin Karşılaştırılması: Türkiye’de BIST’de Bir Uygulama
479
- Tunçel, A. K. (2007) “Rassal Yürüyüş (Random Walk)
Hipotezinin İMKB’de Test Edilmesi: Koşu Testi
Uygulaması” Gazi Üniversitesi İktisadi ve İdari Bilimler
Fakültesi Dergisi, 9(2), 1-18.
- Vapnik, V. N. (1995) The Nature of Statistical Learning
Theory, NewYork: Springer-Verlag.
- Vapnik, V.N. ve Chervonenkis A. (1974) Theory
of Pattern Recognition (in Russian), Nauka,
Moscow. (German translation: W.N. Wapnik, A. Ja.
- Tschervonenkis (1979), Theorie der Zeichenerkennung,
Akademie-Verlag, Berlin.
- Yildiz, B., Coskun, M., ve Yalama, A. (2008) “Forecasting
the Istanbul Stock Exchange National 100 Index Using
an Artificial Neural Network”Proceedings of World
Academy of Science: Engineering & Technology, 48.
- Zengin, H. ve Kurt, S. (2004) “IMKB’nin Zayıf ve Yarı
Güçlü Formda Etkinliğinin Ekonometrik Analizi” Öneri
Dergisi, 21(6), 145-152.
- Zeren, F., Kara, H., ve Arı, A. (2013) “Piyasa Etkinliği
Hipotezi: İMKB İçin Ampirik Bir Analiz” Dumlupınar
Üniversitesi Sosyal Bilimler Dergisi, (36), 141-148.
- Zhang, X., Hu, Y., Xie, K., Wang, S., Ngai, E. W. T., ve Liu,
M. (2014) “A causal feature selection algorithm for
stock prediction modeling” Neurocomputing, 142, 48-
59.
- Zivot, E. (2007) Introduction to Computational
Finance and Financial Econometrics, Chapter 1 Asset
Return Calculations.