Karaciğer mikrodizi kanser verisinin sınıflandırılması için genetik algoritma kullanarak ANFIS’in eğitilmesi
Sınıflandırma, verilerin analiz edilmesi için önemli bir veri madenciliği tekniği olup tıp, genetik ve biyomedikal mühendisliği başta olmak üzere birçok alanda kullanılmaktadır. Özellikle tıp alanında DNA mikrodizi gen ekspresyon verilerini sınıflandırmaya yönelik yapılan çalışmalarda artış görülmektedir. Ancak, mikrodizi gen ekspresyon (ifade) verilerinde bulunan gen sayılarının çokluğu ve bu veriler arasında doğrusal olmayan bağıntılar bulunması gibi problemlerden dolayı geleneksel sınıflandırma algoritmalarının başarımları sınırlı kalabilmektedir. Bu sebeplerden dolayı son yıllarda sınıflandırma probleminin çözümü için yapay zekâ tekniklerine dayalı sınıflandırma yöntemlerine olan ilgi giderek artmaya başlamıştır. Bu çalışmada, karaciğer mikrodizi kanser veri setinin sınıflandırılması için Uyarlamalı Ağ Tabanlı Bulanık Mantık Çıkarım Sistemi (ANFIS) ve Genetik Algoritmaya (GA) dayalı hibrid bir yaklaşım önerilmiştir. Simülasyon sonuçları, diğer bazı yöntemlere ait sonuçlarla karşılaştırılmıştır. Elde edilen sonuçlardan, önerilen yöntemin diğer yöntemlere göre daha başarılı olduğu görülmüştür.
Training ANFIS structure using genetic algorithm for liver cancer classification based on microarray gene expression data
Classification is an important data mining technique, which is used in many fields mostly exemplified as medicine, genetics and biomedical engineering. The number of studies about classification of the datum on DNA microarray gene expression is specifically increased in recent years. However, because of the reasons as the abundance of gene numbers in the datum as microarray gene expressions and the nonlinear relations mostly across those datum, the success of conventional classification algorithms can be limited. Because of these reasons, the interest on classification methods which are based on artificial intelligence to solve the problem on classification has been gradually increased in recent times. In this study, a hybrid approach which is based on Adaptive Neuro-Fuzzy Inference System (ANFIS) and Genetic Algorithm (GA) are suggested in order to classify liver microarray cancer data set. Simulation results are compared with the results of other methods. According to the results obtained, it is seen that the recommended method is better than the other methods.
___
- G. S. Özcan, “Bütünleştirici Modül Ağlarıyla
Gen Düzenleme Analizi,” Başkent Üniversitesi,
2014.
- H. Ü. Lüleyap, Moleküler Genetiğin Esasları.
İzmir: Nobel Kitabevi, 2008.
- H. S. BAL and F. Budak, “Mikroarray
Teknolojisi,” Uludağ Üniversitesi Tıp Fakültesi
Derg, vol. 38, no. 3, pp. 227–233, 2012.
- Ö. Şimşek, “Mikroarray Teknolojisi ve Diş
Hekimliğinde Kullanımı,” Atatürk Üniversitesi
Diş Hekim Fakültesi Derg, vol. 7, pp. 55–62,
2013.
- K. Shakya, H. J. Ruskin, G. Kerr, M. Crane, and
J. Becker, “Comparison of Microarray
Preprocessing Methods,” Springer New York,
2010, pp. 139–147.
- K. Ipekdal, “Microarray Technology,” 2011.
[Online]. Available:
http://yunus.hacettepe.edu.tr/~mergen/sunu/s_m
ikroarrayandecology.pdf. [Accessed: 05-Jul2016].
- H. Liu, I. Bebu, and X. Li, “Microarray probes
and probe sets.,” Front Biosci (Elite Ed), vol. 2,
pp. 325–38, 2010.
- R. Díaz-Uriarte and S. Alvarez de Andrés, “Gene
selection and classification of microarray data
using random forest.,” BMC Bioinformatics, vol.
7, p. 3, 2006.
- S. Dudoit, J. Fridlyand, and T. P. Speed,
“Comparison of Discrimination Methods for the
Classification of Tumors Using Gene Expression
Data Comparison of Discrimination Methods for
the Classi’ cation of Tumors Using Gene
Expression Data,” J Am Stat Assoc, vol. 97457,
no. July, pp. 77–87, 2002.
- T. S. Furey, N. Cristianini, N. Duffy, D. W. Bednarski, M. Schummer, and D. Haussler,
“Support vector machine classification and
validation of cancer tissue samples using
microarray expression data,” Bioinformatics,
vol. 16, no. 10, pp. 906–914, Oct. 2000.
- Y. Lee and C.-K. Lee, “Classification of multiple
cancer types by multicategory support vector
machines using gene expression data.,”
Bioinformatics, vol. 19, no. 9, pp. 1132–1139,
2003.
- H. Liu, J. Li, and L. Wong, “Classification and
Study on Feature Gene Patterns Selection
Expression and Profiles Methods Using
Proteomic,” Genome Informatics, vol. 13, pp.
51–60, 2002.
- A. Statnikov, C. F. Aliferis, I. Tsamardinos, D.
Hardin, and S. Levy, “A comprehensive
evaluation of multicategory classification
methods for microarray gene expression cancer
diagnosis,” Bioinformatics, vol. 21, no. 5, pp.
631–643, 2005.
- J. Khan, J. S. Wei, M. Ringnér, L. H. Saal, M.
Ladanyi, F. Westermann, F. Berthold, M.
Schwab, C. R. Antonescu, C. Peterson, and P. S.
Meltzer, “Classification and diagnostic
prediction of cancers using gene expression
profiling and artificial neural networks.,” Nat
Med, vol. 7, no. 6, pp. 673–9, 2001.
- M. Ringnér and C. Peterson, “Microarray-based
cancer diagnosis with artificial neural networks,”
Biotechniques, vol. 34, no. 3 SUPPL., 2003.
- M. Pirooznia, J. Y. Yang, M. Q. M. Yang, and Y.
Deng, “A comparative study of different
machine learning methods on microarray gene
expression data.,” BMC Genomics, vol. 9 Suppl
1, p. S13, 2008.
- C. Loganathan and K. V Girija, “Cancer
Classification using Adaptive Neuro Fuzzy
Inference System with Runge Kutta Learning,”
Int J Comput Appl, vol. 79, no. 4, 2013.
- K. Anandakumar and M. Punithavalli, “Efficient
Cancer Classification using Fast Adaptive
Neuro-Fuzzy Inference System (FANFIS) based
on Statistical Techniques,” IJACSA) Int J Adv
Comput Sci Appl Spec Issue Artif Intell, pp. 132–
137, 2011.
- M. a. Hall and L. a. Smith, “Practical feature
subset selection for machine learning,” Comput
Sci, vol. 98, pp. 181–191, 1998.
- J. S. R. Jang, “ANFIS: Adaptive-Network-Based
Fuzzy Inference System,” IEEE Trans Syst Man
Cybern, vol. 23, no. 3, pp. 665–685, 1993.
- D. Karaboga and E. Kaya, “Training ANFIS
using artificial bee colony algorithm for
nonlinear dynamic systems identification,” in
2014 22nd Signal Processing and Communications Applications Conference
(SIU), 2014, pp. 493–496.
- S. Uzundurukan, “Determining and modelling of
principal parameters affecting swelling
properties of soils,” Suleyman Demirel , 2006.
- J. S. R. Jang and C. T. Sun, “Neuro-Fuzzy
Modeling and Control,” Proc IEEE, vol. 83, no.
3, pp. 378–406, 1995.
- D. Simon, “Training fuzzy systems with the
extended Kalman filter,” Fuzzy Sets Syst, vol.
132, no. 2, pp. 189–199, 2002.
- M. Mitchell, An introduction to genetic
algorithms. MIT press, 1998.
- M. M. Kervan, “Çoklu Sensör Konumlandırma
Probleminin Genetik Algoritmalar Ve Gen
Havuzu Tabanlı Genetik Agoritmalar İle
Çözülmesi,” Hava Harp Okulu Komutanlığı,
2009.
- “Karaciğer Kanseri Mikroarray Gen İfade Profili
Veri Seti (Chen-2002).” [Online]. Available:
http://bioinformatics.rutgers.edu/Static/Supplem
ents/CompCancer/CDNA/chen-2002/chen2002_database.txt.
- X. Chen, S. T. Cheung, S. So, S. T. Fan, C. Barry,
J. Higgins, K.-M. Lai, J. Ji, S. Dudoit, I. O. L.
Ng, M. van de Rijn, D. Botstein, and P. O.
Brown, “Gene Expression Patterns in Human
Liver Cancers,” Mol Biol Cell, vol. 13, no. 6, pp.
1929–1939, 2002.