VERİ MADENCİLİĞİ MODELLERİNİN AKCİĞER KANSERİ VERİ SETİ ÜZERİNDE BAŞARILARININ İNCELENMESİ

Günümüz bilgi çağında en güncel makine öğrenme yöntemlerinden birisi veri madenciliğidir. Her geçen gün bilgisayar sistemlerinin kapasitelerinin artıyor olması daha büyük miktarlarda verilerin saklanabilmesine imkân vermektedir. Artan veri miktarlarının etkin bir şekilde kullanılmasının en büyük çözümü veri madenciliğidir. Bu sebeple büyük miktardaki verileri işleyebilen teknikleri kullanabilmek günümüzde büyük önem kazanmaktadır. Veri madenciliği bu gibi durumlarda kullanılan, büyük miktardaki veri setlerinde saklı durumda bulunan örüntü ve eğilimleri keşfetme işlemidir. Veriler tek başına değersiz olabilirler ancak işlenip bilgiye dönüştürüldüğünde anlam kazanmaktadırlar. Bu kapsamda veri madenciliği birçok alanda olduğu gibi tıp alanında da kullanılmaktadır. Bu çalışmada Dünya Sağlık Örgütü'nün verilerine göre en yaygın kanser türlerinden olan akciğer kanseri teşhisinin daha hassas yapılabilmesineyönelik bir çalışma yapılmıştır. Çoğu kanser vakası hastalığın son evrelerinde teşhis edilebilmekte ve  tedaviler bu evreden sonra çoğu zaman cevap verememekte ve hasta kayıpları yaşanmaktadır. Bu sebeple, diğer kanser türlerinde olduğu gibi, akciğer kanserinin de erken tanısı hayati önem taşımaktadır. Bu çalışmada, akciğer kanserinin erken tanısına katkıda bulunabilmek amaçlanmıştır. Genel olarak hastalara hastalık belirtileri doğrultusunda akciğer kanseri olup olmadıklarına dair teşhis konulmaktadır. Bu çalışma ile sağlık veritabanında mevcut olan, önceden teşhisi konulmuş vakaların anonim verileri kullanılarak, WEKA veri madenciliği yazılımında hangi algoritmanın bu alanda daha başarılı olabileceğine dair bir çalışma yapılmıştır.

___

  • Han, J., Pei, J., & Kamber, M. (2012). Data Mining Concepts and Techniques. Elsevier.
  • Kaya, A. (2015). Bilgisayar Destekli Tanı Sistemi ile Akciğer Nodüllerinin Nitelendirilmesi. Hacettepe Üniversitesi Doktora Tezi.
  • Koyuncugil, A. S., & Özgülbaş, N. (2009). Veri madenciliği: tıp ve sağlık hizmetlerinde kullanımı ve uygulamaları. Bilişim Teknolojileri Dergisi, 2:21-32.
  • Kudyba, S. (2004). Managing Data Mining. CyberTech Publishing.
  • Longan, S. (2013). Relationship of North Slope Oil and Gas Development to Lung Cancer Mortality. Walden University Doktora Tezi.
  • Medium. (2018, 08 20). Medium. Medium: https://medium.com/@Synced/how-random-forest-algorithm-works-in-machine-learning-3c0fe15b6674 adresinden alındı
  • Oreski, S., Oreski, D., & Oreski, G. (2012). Hybrid System With Genetic Algorithm And Artificial Neural Networks and Its Application To Retail Credit Risk Assessment. Expert Systems with Applications 39, 12605–12617.
  • Özhan, E. (2013). Güvenlik Duvarı Günlüklerinin Makine Öğrenmesi Yöntemleri ile Analizi ve Bir Model Çıkartılması. Trakya Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Doktora Tezi.
  • Pala, T. (2013). Tıbbi Karar Destek Sisteminin Veri Madenciliği Yöntemleriyle Gerçekleştirilmesi. Marmara Üniversitesi Yüksek Lisans Tezi.
  • Parkin, D., Bray, F., Ferlay, J., & Pisani, P. (2005). Global cancer statistics. A Cancer Journal for Clinicians, 55:74-108.
  • Shakir, S. A. (2016). Early Detection of Lung Cancer. Yıldırım Beyazıt Ünversitesi Yüksek Lisans Tezi.
  • Siyah, B. (2012). Oracle Data Miner İle Göğüs Kanseri Verileri Üzerine Bir Veri Madenciliği Uygulaması. İskenderun.
  • Spiro, S., & Porter, J. (2002). Lung cancer-Where are we today? Current advances in staging and nonsurgical treatment. American Journal of Respiratory and Critical Care Medicine, 166:1166-1196.
  • Şentürk, Z. K. (2011). Veri Madenciliği ile kanser tanısı. Düzce Üniversitesi Yüksek Lisans Tezi.
  • Taşçı, A. E. (2013). Akciğer Tomografileri Kullanılarak Yapay Zeka ve Görüntü İşleme Tekniklerinde Dayalı Otomatik Nodül Bölge Tepit Yöntemi Geliştirilmesi.
  • Türkiye Halk Sağlığı Kurumu. (2018, 7 18). Türkiye Halk Sağlığı Kurumu Türkiye Kanser İstatistikleri. Sağlık Bakanlığı: https://dosyasb.saglik.gov.tr/Eklenti/13183,sy2016turkcepdf.pdf?0 adresinden alındı
  • Witten, I. E., Frank, E., Hall, M. A., & Pal, C. J. (2016). Data Mining: Practical machine Learning tools and techniques. Morgan Kaufmann.
  • Yıldırım, P., Uludağ, M., & Görür, A. (2008). Hastane Bilgi Sistemlerinde Veri Madenciliği. Akademik Bilişim 2008 Konferansı. Çanakkale.
  • Yılmaz, A., & Ayan, K. (2013). Cancer risk analysis by fuzzy logic approach and performance status of the model. Turkish Journal of Electrical Engineering & Computer Sciences, 910 doi:10.3906/elk-1108-22.
  • Yılmaz, M., Topaloğlu, N., & Savaş, S. (2012). Veri Madenciliği ve Türkiye’deki Uygulama Örnekleri. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, Sayı: 21, 1-23.