Karaciğer mikrodizi kanser verisinin sınıflandırılması için genetik algoritma kullanarak ANFIS’in eğitilmesi

Sınıflandırma, verilerin analiz edilmesi için önemli bir veri madenciliği tekniği olup tıp, genetik ve biyomedikal mühendisliği başta olmak üzere birçok alanda kullanılmaktadır. Özellikle tıp alanında DNA mikrodizi gen ekspresyon verilerini sınıflandırmaya yönelik yapılan çalışmalarda artış görülmektedir. Ancak, mikrodizi gen ekspresyon (ifade) verilerinde bulunan gen sayılarının çokluğu ve bu veriler arasında doğrusal olmayan bağıntılar bulunması gibi problemlerden dolayı geleneksel sınıflandırma algoritmalarının başarımları sınırlı kalabilmektedir. Bu sebeplerden dolayı son yıllarda sınıflandırma probleminin çözümü için yapay zekâ tekniklerine dayalı sınıflandırma yöntemlerine olan ilgi giderek artmaya başlamıştır. Bu çalışmada, karaciğer mikrodizi kanser veri setinin sınıflandırılması için Uyarlamalı Ağ Tabanlı Bulanık Mantık Çıkarım Sistemi (ANFIS) ve Genetik Algoritmaya (GA) dayalı hibrid bir yaklaşım önerilmiştir. Simülasyon sonuçları, diğer bazı yöntemlere ait sonuçlarla karşılaştırılmıştır. Elde edilen sonuçlardan, önerilen yöntemin diğer yöntemlere göre daha başarılı olduğu görülmüştür.

Training ANFIS structure using genetic algorithm for liver cancer classification based on microarray gene expression data

Classification is an important data mining technique, which is used in many fields mostly exemplified as medicine, genetics and biomedical engineering. The number of studies about classification of the datum on DNA microarray gene expression is specifically increased in recent years. However, because of the reasons as the abundance of gene numbers in the datum as microarray gene expressions and the nonlinear relations mostly across those datum, the success of conventional classification algorithms can be limited. Because of these reasons, the interest on classification methods which are based on artificial intelligence to solve the problem on classification has been gradually increased in recent times. In this study, a hybrid approach which is based on Adaptive Neuro-Fuzzy Inference System (ANFIS) and Genetic Algorithm (GA) are suggested in order to classify liver microarray cancer data set. Simulation results are compared with the results of other methods. According to the results obtained, it is seen that the recommended method is better than the other methods.

___

  • G. S. Özcan, “Bütünleştirici Modül Ağlarıyla Gen Düzenleme Analizi,” Başkent Üniversitesi, 2014.
  • H. Ü. Lüleyap, Moleküler Genetiğin Esasları. İzmir: Nobel Kitabevi, 2008.
  • H. S. BAL and F. Budak, “Mikroarray Teknolojisi,” Uludağ Üniversitesi Tıp Fakültesi Derg, vol. 38, no. 3, pp. 227–233, 2012.
  • Ö. Şimşek, “Mikroarray Teknolojisi ve Diş Hekimliğinde Kullanımı,” Atatürk Üniversitesi Diş Hekim Fakültesi Derg, vol. 7, pp. 55–62, 2013.
  • K. Shakya, H. J. Ruskin, G. Kerr, M. Crane, and J. Becker, “Comparison of Microarray Preprocessing Methods,” Springer New York, 2010, pp. 139–147.
  • K. Ipekdal, “Microarray Technology,” 2011. [Online]. Available: http://yunus.hacettepe.edu.tr/~mergen/sunu/s_m ikroarrayandecology.pdf. [Accessed: 05-Jul2016].
  • H. Liu, I. Bebu, and X. Li, “Microarray probes and probe sets.,” Front Biosci (Elite Ed), vol. 2, pp. 325–38, 2010.
  • R. Díaz-Uriarte and S. Alvarez de Andrés, “Gene selection and classification of microarray data using random forest.,” BMC Bioinformatics, vol. 7, p. 3, 2006.
  • S. Dudoit, J. Fridlyand, and T. P. Speed, “Comparison of Discrimination Methods for the Classification of Tumors Using Gene Expression Data Comparison of Discrimination Methods for the Classi’ cation of Tumors Using Gene Expression Data,” J Am Stat Assoc, vol. 97457, no. July, pp. 77–87, 2002.
  • T. S. Furey, N. Cristianini, N. Duffy, D. W. Bednarski, M. Schummer, and D. Haussler, “Support vector machine classification and validation of cancer tissue samples using microarray expression data,” Bioinformatics, vol. 16, no. 10, pp. 906–914, Oct. 2000.
  • Y. Lee and C.-K. Lee, “Classification of multiple cancer types by multicategory support vector machines using gene expression data.,” Bioinformatics, vol. 19, no. 9, pp. 1132–1139, 2003.
  • H. Liu, J. Li, and L. Wong, “Classification and Study on Feature Gene Patterns Selection Expression and Profiles Methods Using Proteomic,” Genome Informatics, vol. 13, pp. 51–60, 2002.
  • A. Statnikov, C. F. Aliferis, I. Tsamardinos, D. Hardin, and S. Levy, “A comprehensive evaluation of multicategory classification methods for microarray gene expression cancer diagnosis,” Bioinformatics, vol. 21, no. 5, pp. 631–643, 2005.
  • J. Khan, J. S. Wei, M. Ringnér, L. H. Saal, M. Ladanyi, F. Westermann, F. Berthold, M. Schwab, C. R. Antonescu, C. Peterson, and P. S. Meltzer, “Classification and diagnostic prediction of cancers using gene expression profiling and artificial neural networks.,” Nat Med, vol. 7, no. 6, pp. 673–9, 2001.
  • M. Ringnér and C. Peterson, “Microarray-based cancer diagnosis with artificial neural networks,” Biotechniques, vol. 34, no. 3 SUPPL., 2003.
  • M. Pirooznia, J. Y. Yang, M. Q. M. Yang, and Y. Deng, “A comparative study of different machine learning methods on microarray gene expression data.,” BMC Genomics, vol. 9 Suppl 1, p. S13, 2008.
  • C. Loganathan and K. V Girija, “Cancer Classification using Adaptive Neuro Fuzzy Inference System with Runge Kutta Learning,” Int J Comput Appl, vol. 79, no. 4, 2013.
  • K. Anandakumar and M. Punithavalli, “Efficient Cancer Classification using Fast Adaptive Neuro-Fuzzy Inference System (FANFIS) based on Statistical Techniques,” IJACSA) Int J Adv Comput Sci Appl Spec Issue Artif Intell, pp. 132– 137, 2011.
  • M. a. Hall and L. a. Smith, “Practical feature subset selection for machine learning,” Comput Sci, vol. 98, pp. 181–191, 1998.
  • J. S. R. Jang, “ANFIS: Adaptive-Network-Based Fuzzy Inference System,” IEEE Trans Syst Man Cybern, vol. 23, no. 3, pp. 665–685, 1993.
  • D. Karaboga and E. Kaya, “Training ANFIS using artificial bee colony algorithm for nonlinear dynamic systems identification,” in 2014 22nd Signal Processing and Communications Applications Conference (SIU), 2014, pp. 493–496.
  • S. Uzundurukan, “Determining and modelling of principal parameters affecting swelling properties of soils,” Suleyman Demirel , 2006.
  • J. S. R. Jang and C. T. Sun, “Neuro-Fuzzy Modeling and Control,” Proc IEEE, vol. 83, no. 3, pp. 378–406, 1995.
  • D. Simon, “Training fuzzy systems with the extended Kalman filter,” Fuzzy Sets Syst, vol. 132, no. 2, pp. 189–199, 2002.
  • M. Mitchell, An introduction to genetic algorithms. MIT press, 1998.
  • M. M. Kervan, “Çoklu Sensör Konumlandırma Probleminin Genetik Algoritmalar Ve Gen Havuzu Tabanlı Genetik Agoritmalar İle Çözülmesi,” Hava Harp Okulu Komutanlığı, 2009.
  • “Karaciğer Kanseri Mikroarray Gen İfade Profili Veri Seti (Chen-2002).” [Online]. Available: http://bioinformatics.rutgers.edu/Static/Supplem ents/CompCancer/CDNA/chen-2002/chen2002_database.txt.
  • X. Chen, S. T. Cheung, S. So, S. T. Fan, C. Barry, J. Higgins, K.-M. Lai, J. Ji, S. Dudoit, I. O. L. Ng, M. van de Rijn, D. Botstein, and P. O. Brown, “Gene Expression Patterns in Human Liver Cancers,” Mol Biol Cell, vol. 13, no. 6, pp. 1929–1939, 2002.