Tekrarlayıcı Sinir Ağları ile Mikropların Sınıflandırılması

Mikroplar insan vücudunun hem içinde hem de dışında yaşayan ve hemen hemen her yerde bulunan tek hücreli küçük canlılardır. Zararlı olabileceği gibi zararı olmayan mikroplarda bulunmaktadır. Bu yüzden mikroplar ekolojik dengenin sağlanmasında büyük bir rol üstlenmektedir. Ancak, bu mikropları birbirinden ayırt edebilmek çoğu zaman meşakkatli bir iş olmaktadır. Mikropların çeşitli özelliklerini anlayan ve taksonomi nüanslarını yorumlayabilen bir uzman bilgisinin gerekmesi ve laboratuvar ihtiyacının olması bu süreci hem maliyetli hem de zaman alıcı yapmaktadır. Bundan dolayı, bilgisayar destekli sistemlerin bu alanda önemi artmış ve günümüzde yapay zeka teknolojileri mikropların sınıflandırılmasında kullanılmaya başlanmıştır. Makine öğrenmesi ve derin öğrenme teknolojilerinin bu alana uygulanmasıyla yüksek seviyede doğruluk skorları elde edilmekte ve biyoçeşitlilikle ilgili değerlendirmeler otomatik bir şekilde yapılabilmektedir. Bu çalışmada da derin öğrenme modellerinden biri olan tekrarlayıcı sinir ağları yapıları kullanılarak, mikropların sınıflandırılması yapılmıştır. Çalışma dört aşamadan meydana gelmiştir. Birinci aşamada, veriler elde edilmiştir. İkinci aşamada bu veriler normalleştirme işlemine tabi tutulmuş ve önişlemden geçirilmiştir. Üçüncü aşamada UKSB ve TSA modelleri tasarlanmış ve sınıflandırılmıştır. Son aşamada ise sınıflandırıcıların performansları doğruluk, kesinlik, duyarlılık, F1-skor ve AUC skoru ile belirlenmiştir. Çalışmanın sonunda TSA sınıflandırıcısı ile %92.53, UKSB sınıflandırıcısıyla ise %99.85 doğruluk skoru elde edilmiştir.

Classification of Microbes with Recurrent Neural Networks

Microbes are tiny single-celled creatures that live both inside and outside the human body and are found almost everywhere. There are microbes that can be harmful as well as harmless. Therefore, microbes play a major role in maintaining the ecological balance. However, distinguishing these microbes from each other is often a difficult task. The need for a specialist who understands the various characteristics of microbes and can interpret taxonomy nuances and the need for a laboratory makes this process both costly and time consuming. Therefore, the importance of computer aided systems in this field has increased and artificial intelligence technologies have begun to be used in the classification of microbes today. With the application of artificial intelligence technologies to this field, high level accuracy scores are obtained, and biodiversity assessments can be made automatically. In this study, microbes were classified by using deep learning models, which is one of the artificial intelligence methods. The study consisted of four stages. In the first stage, the data were obtained. In the second stage, these data were preprocessed and normalized. In the third stage, LSTM and RNN models are designed, and data were classified. In the last stage, the performances of the classifiers were determined by accuracy, precision, recall, F1-score, and AUC score. At the end of the study, an accuracy score of 92,53% was obtained with the RNN classifier and 99,85% with the LSTM classifier.

___

  • Oka A, Sartor RB. Microbial-based and microbial-targeted therapies for inflammatory bowel diseases. Dig Dis Sci 2020; 65: 757-788.
  • Boxberger M, Cenizo V, Cassir N, Scola BL. Challenges in exploring and manipulating the human skin microbiome. Microbiome 2021; 9.
  • Yu K, Pieterse CMJ, Bakker PAHM, Berendsen RL. Beneficial microbes going underground of root immunity. Plant Cell Environ 2019; 42: 2860-2870.
  • Schirmer M, Garner A, Vlamakis H, Xavier RJ. Microbial genes and pathways in inflammatory bowel diseases. Nat Rev Microbiol 2019; 17: 497-511.
  • Björk JR, Diez-Vives C, Astudillo-Garcia C, Arcihe EA, Montaya JM. Vertical transmission of sponge microbiota is inconsistent and unfaithful. Nat Ecol Evol 2019; 3: 1172-1183.
  • Buszewski B, Rogowska A, Pomastowski P, Zloch M, Railean-Plugaru V. Identification of microorganisms by modern analytical techniques. J AOAC Int 2017; 100(6): 1607-1623.
  • Ganegoda S, Chinthaka SDM, Manage PM. Geosmin contamination status of raw and treated waters in Sri Lanka. J Natl Sci Found Sri Lanka 2019; 47(2): 245-259.
  • Ferone M, Gowen A, Fanning S, Scannell AGM. Microbial detection and identification methods: Bench top assays to omics approaches. Compr Rev Food Sci Food Saf 2020; 19(6): 3106-3129.
  • Dhindsa A, Bhatia S, Agrawal S, Sohi BS. An improvised machine learning model based on mutual information feature selection approach for microbes classification. Entropy 2021; 23(2).
  • Promdaen S, Wattuya P, Sanevas N. Automated microalgae image classification. Procedia Comput Sci 2014; 29: 1981-1992.
  • Coltelli P, Barsanti L, Evangelista V, Frassanito AM, Gualtieri P. Water monitoring: automated and real time identification and classification of algae using digital microscopy. Environ Sci Process Impacts 2014; 16(11): 2656 – 2665.
  • Dhindsa A, Bhatia S, Agrawal S, Sohi BS. Dataset for efficient microbes classification system. Mendeley Data 2021; 4.
  • Cui Z, Ke R, Pu Z, Wang Y. Deep bidirectional and unidirectional LSTM recurrent neural network for network-wide traffic speed prediction. arXiv 2019; 1-11.
  • Ribeiro AH, Tiels K, Aguirre LA, Schön TB. Beyond exploding and vanishing gradients: analysing RNN training using attractors and smoothness. In: 23rd International Conference on Artificial Intelligence and Statistics; 26-28 August 2020; Online: pp. 2370-2380.
  • Takeuchi D, Yatabe K, Koizumi Y, Oikawa Y, Harada N. Real-time speech enhancement using equilibriated RNN. In: International Conference on Acoustics, Speech, and Signal Processing; 04-08 May 2020; Barcelona, Spain.
  • Yu Y, Si X, Hu C, Zhang J. A review of recurrent neural networks: LSTM cells and network architectures. Neural Comput 2019; 31(7): 1235-1270.
  • Rosset S. Model selection via the AUC. In: 21st International Conference on Machine Learning; 04-08 July 2004; New York.
  • Hosmer DW, Lemeshow S, Sturdivant RX. Applied Logistic Regression. 3rd ed. John Wiley and Sons, Inc.
  • Mahmud M, Kaiser MS, McGinnity TM, Hussain A. Deep learning in mining biological data. Cognit Comput 2021; 13: 1-33.