Karaciğer Mikroarray Kanser Verisinin Sınıflandırılması için Genetik Algoritma Kullanarak ANFIS’in eğitilmesi

 Sınıflandırma, verilerin analiz edilmesi için önemli bir veri madenciliği tekniği olup tıp, genetik ve biyomedikal mühendisliği başta olmak üzere birçok alanda kullanılmaktadır. Özelikle tıp alanında DNA mikroarray gen ekspresyon verilerini sınıflandırmaya yönelik yapılan çalışmalarda artış görülmektedir. Ancak, mikroarray gen ekspresyon (ifade) verilerinde bulunan gen sayılarının çokluğu ve bu veriler arasında çoğunlukla doğrusal olmayan ilişkiler bulunması gibi nedenlerden dolayı geleneksel sınıflandırma algoritmalarının başarımları sınırlı kalabilmektedir. Bu sebeplerden dolayı son yıllarda sınıflandırma probleminin çözümü için yapay zekâ tekniklerine dayalı sınıflandırma yöntemlerine olan ilgi giderek artmaya başlamıştır. Bu çalışmada, karaciğer mikroarray kanser veri setinin sınıflandırılması için Adaptif Ağ Tabanlı Bulanık Mantık Çıkarım Sistemi (ANFIS) ve Genetik Algoritmaya (GA) dayalı hibrid bir yaklaşım önerilmiştir. Simülasyon sonuçları, diğer bazı yöntemlere ait sonuçlarla karşılaştırılmıştır. Elde edilen sonuçlardan, önerilen yöntemin diğer yöntemlere göre daha başarılı olduğu görülmüştür.

Training ANFIS structure using genetic algorithm for liver cancer classification based on microarray gene expression data

Classification is an important data mining technique, which is used in many fields mostly exemplified as medicine,genetics and biomedical engineering. The number of studies about classification of the datum on DNA microarraygene expression is specifically increased in recent years. However, because of the reasons as the abundance of genenumbers in the datum as microarray gene expressions and the nonlinear relations mostly across those datum, thesuccess of conventional classification algorithms can be limited. Because of these reasons, the interest on classificationmethods which are based on artificial intelligence to solve the problem on classification has been gradually increasedin recent times. In this study, a hybrid approach which is based on Adaptive Neuro-Fuzzy Inference System (ANFIS)and Genetic Algorithm (GA) are suggested in order to classify liver microarray cancer data set. Simulation results arecompared with the results of other methods. According to the results obtained, it is seen that the recommended methodis better than the other methods.

___

  • 1. S. G. Özcan, “Bütünleştirici Modül Ağlarıyla Gen Düzenleme Analizi”, Başkent Üniversitesi, Fen Bilimleri Enstitüsü, Yüksek Lisans Tezi, Ankara, 62 s, 2014.
  • 2. H. Ü. Lüleyap, “Moleküler Genetiğin Esasları”, Nobel Kitabevi, 437 s, 2008.
  • 3. S. H. Bal, F. Budak, “Mikroarray teknolojisi”, Uludağ Üniversitesi Tıp Fakültesi Dergisi, vol. 38, no. 3, pp. 227-233, 2012.
  • 4. D. F. Atat, U. Supplement, E. K. Derleme, M. Kodu, and K. Tarihi, “Mikroarray Teknolojisi ve Diş Hekimliği’nde Kullanımı Dt. Özge ŞİMŞEK*,” pp. 55–62, 2012.
  • 5. Shakya, K., Ruskin, H. J., Kerr, G., Crane, M., Becker, J., “Comparison of microarray preprocessing methods”, In Advances in Computational Biology, Springer New York, pp. 139-147, 2010.
  • 6. İpekdal, K., Microarray teknolojisi. (Web sayfası: http:// yunus.hacettepe.edu.tr /~mergen/sunu/s_mikroarrayandecology.pdf) (Erişim Tarihi: Nisan 2015)
  • 7. H. Liu, I. Bebu, and X. Li, “Microarray probes and probe sets.,” Front. Biosci. (Elite Ed)., vol. 2, pp. 325–38, 2010.
  • 8. M. Pirooznia, J. Y. Yang, M. Q. M. Yang, and Y. Deng, “A comparative study of different machine learning methods on microarray gene expression data.,” BMC Genomics, vol. 9 Suppl 1, p. S13, 2008.
  • 9. C. Loganathan and D. Ph, “Cancer Classification using Adaptive Neuro Fuzzy Inference System with Runge Kutta Learning,” vol. 79, no. October, pp. 46–50, 2013.
  • 10. K. Anandakumar and M. P. -, “Efficient Cancer Classification using Fast Adaptive Neuro-Fuzzy Inference System (FANFIS) based on Statistical Techniques,” Int. J. Adv. Comput. Sci. Appl., vol. 1, no. 3, pp. 132–137, 2011.
  • 11. D. Simon, “Training fuzzy systems with the extended Kalman filter,” Fuzzy Sets Syst., vol. 132, no. 2, pp. 189–199, 2002.
  • 12. M. a. Hall and L. a. Smith, “Practical feature subset selection for machine learning,” Comput. Sci., vol. 98, pp. 181–191, 1998.
  • 13. Jang, J. S. R., “ANFIS: Adaptive network-based fuzzy inference systems”, IEEE Trans. Syst., Man. and Cybern, Cilt 23, 665-685, 1993.
  • 14. D. Karaboga, E. Kaya, Training ANFIS using artificial bee colony algorithm for nonlinear dynamic system identification, in: IEEE 22nd Signal Processing and Communications Applications Conference (SIU), 2014, pp. 493-496.
  • 15. Uzundurukan, S., Zeminlerin Şişme Özelliklerine Etkiyen Temel Parametrelerin Belirlenmesi ve Modellenmesi, Doktora Tezi, İnşaat Mühendisliği Anabilim Dalı, Isparta, 2006.
  • 16. Jang, J. S. R., Sun, C. T., “Neuro-Fuzzy Modeling and Control”, proceedings of the IEEE, Cilt 83, 3, 1995.
  • 17. M. Mitchell, “An Introduction to Genetic Algorithms”, MIT Press, 1998.
  • 18. Mustafa M. Kevran, “Çoklu Sensör Konumlandırma Probleminin Genetik Algoritmalar ile Çözümü”, Havacılık ve Uzay Teknolojileri Enstitüsü, Yüksek Lisans Tezi, İstanbul, 124 s, 2009.
  • 19. İnternet: Rutgers Üniversitesi Biyoinformatik Laboratuvarı http://bioinformatics.rutgers.edu/
  • 20. Chen, Xin, et al., “Gene expression patterns in human liver cancers”. Molecular biology of the cell, vol. 13, no. 6, pp. 1929-1939, 2002.
  • 21. İnternet: Karaciğer Kanseri Veri Seti (Chen-2002), http://bioinformatics.rutgers.edu/Static/Supplements/CompCancer/CDNA/chen-2002/chen-2002_database.txt