Zaman serisi kümelemesi yaklaşımı ile oecd ülkelerinin ithalatının tahmini

Zaman serisi kümelemesi, finans, ekonomi, mühendislik, vs gibi birçok alanda son zamanlarda yaygın olarak kullanılmaktadır. Zaman serisi kümelemesindeki amaç, bir zaman serisi kümesi verildiğinde birbirine benzer zaman serilerini kümelemek ve her küme için tek bir model uydurmaktır. Böylece hem kurulan model sayısının oldukça azaltılması hem de gözlem sayısının az olduğu zaman serileri için tahmin ve öngörü işleminin daha etkin bir şekilde yapılabilmesi mümkün olmaktadır. Bu amaca yönelik olarak çeşitli kümeleme yöntemleri kullanılmıştır. Bu çalışmada kümeleme yöntemi olarak, Bulanık C-Oto Regresif Model (BCORM) kullanılmıştır. BCORM ve 1. dereceden otoregresif model (AR(1)), OECD ülkelerinin 1997-2010 yılları arasında ithalat göstergesini içeren veri setine uygulanmıştır. Modellerin parametre tahmini ve öngörüdeki performanslarını karşılaştırmak amacıyla her ülkeye ilişkin veri seti, %75’i eğitim %25’i test seti olacak şekilde ikiye ayrılmıştır. Karşılaştırma kriteri olarak Ortalama Mutlak Yüzde Hata ve Ortalama Hata Kareler kullanılmıştır. Yapılan analizler hem tahmin hem de öngörüde BCORM’in performansının daha iyi olduğunu göstermiştir.

Import estimation of oecd countries with time series clustering

Time series clustering is widely used in many domains such as finance, economy and engineering etc. recently. The objective in time series clustering is to cluster time series that have similar with each other and is to fit a single model for each cluster. Thus, it is possible both to reduce number of models fitted and to make the estimation and forecasting efficiently with small number of observations. In this study, Fuzzy C-Auto Regressive Model (FCARM) is used as clustering method. FCARM and first-order autoregressive model are fitted to import data set of OECD countries. For comparing performances of these models in estimating parameters and forecasting, data set is divided into two parts for each country: 75% as training and 25% as test set. Mean Absolute Percentage Error and Mean Square Error are used as comparison criteria. The analyses have shown that FCARM has better performance in estimation and forecasting.

___

  • SEBASTIANI, P.,European Schoolpp. 169-183. RAMONI, M., (2001), “CommonPopulations”, Research In OfficialTrends in Statistics,
  • LIN, Tsair, C., (2007), “A Semi-Supervised Bayesian Clustering With Autoregressive Model Based For Time Series Data”, 10 th Joint Conference on Information Sciences.
  • VILAR-FERNANDEZ, J.A., ALONSO, A.M. and VILAR-FERNANDEZ, J.M. (2010). “Nonlinear time series clustering based on nonparametric forecast densities” Comput. Statist. Data Anal., 54, pp. 2850–2865.
  • LEE, T., XIAO, Y., MENG, X., DULING, D., “Clustering Time Series Based on Forecast Distributions Using Kullback-Leibler Divergence” http://forecasters.org/wp/wp-content /uploads/gravity_forms/7-2a51b93047891f1ec3608bdbd77ca58d/2013/06/ ISF2013 LEE_TSClustering.pdf
  • BANDYOPADHYAY, S., BARAGONA, R., MAULIK, U., (2010), “Fuzzy Clustering of Univariate and Multivariate Time Series by Genetic Multiobjective Optimization”, Comisef Working Papers Series.
  • COPPI, R., D’URSO, P., GIORDANI, P., (2010) “A Fuzzy Clustering Model For Multivariate Spatial Time Series”, Journal of Classification, 27, pp.54-88.
  • RUNKLER, Thomas, A., SEEDING, Hans, G., (2008), “Fuzzy C-Auto Regression Models” IEEE World Congress on Computational Intelligence, Proceeding Books, pp. 1818-1825.
  • BOX, George, E., P. JENKINS, Gwilym, M., REINSEL Gregory C., (2008), Time Series Analysis: Forecasting andControl,New York:Wiley.
  • HATHAWAY, Richard, J., BEZDEK, James, C., (1993), “Switching Regression Models and Fuzzy Clustering”, IEEE Transactions On Fuzzy Systems, (1):3, pp. 195-204.