Mamografik Kitle Sınıfının Makine Öğrenmesi Teknikleri ile Tespiti

Meme Kanseri, dünyada kadınlar arasında ölüme neden olabilen kanser tiplerinin en sık görülenlerinden biridir. Günümüzde meme kanseri teşhisinde farklı görüntüleme yöntemleri kullanılmakla birlikte bu yöntemler zaman zaman gereksiz biyopsiye yönlendirebilmektedir. Bu çalışmada, Makine Öğrenmesi Tekniklerinden, Karar Ağaçları ve Yapay Sinir Ağları yöntemleri kullanılarak mamografik kitlenin sınıfı, hastaya ve kitleye ait özelliklerin değerinden tespit edilmiştir. Karar Ağaçlarında, GINI algoritması kullanılmış ve RapidMiner programından yararlanılmıştır. Yapay Sinir Ağlarında, ileri beslemeli geri yayılımlı ağ modeli MATLAB’de yazılan program aracılığı ile kullanılmıştır. Bu çalışmada kullanılan veri seti, Erlangen-Nuremberg Üniversitesi, Radyoloji Enstitüsü, Jinekolojik Radyoloji bölümünden elde edilen 961 örnekten oluşmaktadır. Her örnek için 5 adet özellik mevcuttur. Bu özellikler, BI-RADS (Meme Görüntüleme Raporlama ve Veri Sistemleri) değerlendirmesi, Yaş, Kitle Şekli, Kitlenin Kenar Boşluğu ve Kitlenin Yoğunluğu bilgilerini içermektedir. Yaklaşımımız, mamografide tespit edilen kitleleri iyi huylu ve kötü huylu olmak üzere iki farklı sınıfa ayırmaktadır. Her iki yöntemin başarı analizleri ve karşılaştırılması, hata matrisindeki değerler kullanılarak doğruluk, duyarlılık, kesinlik, seçicilik ve F-skor değerlerine bakılarak yapılmıştır.

Detection of Mammographic Mass Class with Machine Learning Techniques

Breast cancer is one the most common types of cancers among the women in the world. Today different scanning techniques have been used to diagnose breast cancers but these methods are sometimes directed to unnecessary biopsy. In this study, the class of the mammographic mass was determined from the values of the characteristics of the patient and the mass by using decision trees and artificial neural networks methods, which are machine learning techniques. GINI algorithm is used in decision trees and RapidMiner program was used. In artificial neural networks, feed forward back propagation network model is used through the program written in MATLAB. The data set used in this study is consisted of 961 samples obtained at Erlangen-Nuremberg University, Intstitute of Radiology, Department of Ginecological Radiology. There are 5 attributes in each sample. These attributes contain BI-RADS (breast imaging reporting and data systems) value, age, mass shape, mass margin and information about mass density. Our approach distinguished the masses contained at mammography into two different groups as benign and malign masses. Comparison of the performances of both methods was made by looking at the values of accuracy, sensitivity, precision, selectivity, F-score and AUC (area under the curve).

___

  • [1] S. K. M. Hamouda, M. E. Wahed, R. H. Abo Alez, and K. Riad, “Robust breast cancer prediction system based on rough set theory at National Cancer Institute of Egypt,” Comput. Methods Programs Biomed., vol. 153, pp. 259–268, 2018.
  • [2] M. Elter, R. Schulz-Wendtland, and T. Wittenberg, “The prediction of breast cancer biopsy outcomes using two CAD approaches that both emphasize an intelligible decision process: Prediction of breast biopsy outcomes using CAD approaches,” Med. Phys., vol. 34, no. 11, pp. 4164–4172, 2007.
  • [3] M. R. Killi, “Meme kanserlerinin tanısında ve taramasında ultrasonografi,” Türkiye Klinikleri Genel Cerrahi - Özel Konular, vol. 6, no. 2, pp. 7–14, 2013.
  • [4] Ş. U. Sürücü, “BIRADS Sınıflamasına Göre Değerlendirilen Meme Lezyonlu Hastalarda Progresyon Varlığının Araştırılması Ve Risk Faktörleriyle İlişkilendirilmesi,” in Tıpta Uzmanlık Tezi (Basılmış), Selçuk Üniversitesi, Tıp Fakültesi, Konya, 2015, pp. 1–51.
  • [5] I. Fondón et al., “Automatic classification of tissue malignancy for breast carcinoma diagnosis,” Comput. Biol. Med., vol. 96, pp. 41–51, 2018.
  • [6] A. Helwan, J. B. Idoko, and R. H. Abiyev, “Machine learning techniques for classification of breast tissue,” Procedia Comput. Sci., vol. 120, pp. 402–410, 2017.
  • [7] D. M. Vo, N.-Q. Nguyen, and S.-W. Lee, “Classification of breast cancer histology images using incremental boosting convolution networks,” Inf. Sci. (Ny), vol. 482, pp. 123–138, 2019.
  • [8] E. Aydemir and İ. Karslıoğlu, “Akıllı Telefonların İvmeölçer Sensörü Yardımıyla Yürüyüş Deseni Analizi,” Afyon Kocatepe Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi, vol. 21, pp. 283–299.
  • [9] R. Pan, T. Yang, J. Cao, K. Lu, and Z. Zhang, “Missing data imputation by K nearest neighbours based on grey relational structure and mutual information,” Appl. Intell., vol. 43, no. 3, pp. 614–632, 2015.
  • [10] A. Altunkaynak, E. E. Başakin, and E. Kartal, “Dalgacık K-En Yakın Komşuluk Yöntemi ile Hava Kirliliği Tahmini,” Uludağ Univ. J. Fac. Eng., pp. 1547–1556, 2020.
  • [11] M. F. Adak and N. Yurtay, “Gini algoritmasını kullanarak karar ağacı oluşturmayı sağlayan bir yazılımın geliştirilmesi,” Bilişim Teknolojileri Dergisi, vol. 6, no. 3, pp. 1–6, 2014.
  • [12] E. Sezer, A. Bozkir, S. Yagiz, and C. Gokceoglu, “Karar ağacı derinliğinin CART algoritmasında kestirim kapasitesine etkisi: bir tünel açma makinesinin ilerleme hızı üzerinde uygulama,” Akıllı Sistemlerde Yenilikler ve Uygulamaları Sempozyumu, pp. 21–24, 2010.
  • [13] H. Zheng, L. Chen, X. Han, X. Zhao, and Y. Ma, “Classification and regression tree (CART) for analysis of soybean yield variability among fields in Northeast China: The importance of phosphorus application rates under drought conditions,” Agric. Ecosyst. Environ., vol. 132, no. 1–2, pp. 98–105, 2009.
  • [14] X. Wu, The top ten algorithms in data mining. London, England: CRC Press, 2009.
  • [15] B. Ataseven, “Yapay sinir ağları ile öngörü modellemesi,” Öneri Dergisi, vol. 10, pp. 101–115, 2013.
  • [16] A. Dahamsheh and H. Aksoy, “Kurak bölge aylık yağışlarının Markov zinciri eklenmiş koşullu ileri beslemeli geri yayılım yapay sinir ağları ile tahmini,” İTÜ Dergisi Seri D: Mühendislik, vol. 8, no. 6, pp. 37–48, 2009.
  • [17] İ. Ateş and T. T. Bı̇lgı̇n, “The investigation of the success of different machine learning methods in breast cancer diagnosis,” Konuralp tıp derg., 2021.
  • [18] J. Brownlee, “A gentle introduction to the fbeta-measure for machine learning,” Machine Learning Mastery, 23-Feb-2020. [Online]. Available: https://machinelearningmastery.com/fbeta-measurefor-machine-learning/. [Accessed: 02-Oct-2021].
  • [19] S. Kılıç, “Klinik karar vermede ROC analizi,” Journal of Mood Disorders, vol. 3, 2013.
  • [20] K. Polat and S. Güneş, “Breast cancer diagnosis using least square support vector machine,” Digit. Signal Process., vol. 17, no. 4, pp. 694–701, 2007.
  • [21] M. F. Akay, “Support vector machines combined with feature selection for breast cancer diagnosis,” Expert Syst. Appl., vol. 36, no. 2, pp. 3240–3247, 2009.
  • [22] A. Mert, N. Kılıç, E. Bilgili, and A. Akan, “Breast cancer detection with reduced feature set,” Comput. Math. Methods Med., vol. 2015, p. 265138, 2015.
  • [23] H. Asri, H. Mousannif, H. A. Moatassime, and T. Noel, “Using machine learning algorithms for breast cancer risk prediction and diagnosis,” Procedia Comput. Sci., vol. 83, pp. 1064–1069, 2016.
  • [24] M. Milosevic, D. Jankovic, and A. Peulic, “Comparative analysis of breast cancer detection in mammograms and thermograms,” Biomed. Tech. (Berl.), vol. 60, no. 1, pp. 49–56, 2015.
  • [25] D. Altaş and V. Gülpınar, “Karar ağaçları ve yapay sinir ağlarının sınıflandırma performanslarının karşılaştırılması,” Trakya Üniversitesi Sosyal Bilimler Dergisi, vol. 14, no. 1, pp. 1–22, 2012.