ULUSLARARASI HABER RAPORLARININ RAPOR İÇERİKLERİNDE KULLANILAN İFADELERE GÖRE MAKİNE ÖĞRENMESİ YÖNTEMİYLE SINIFLANDIRILMASI VE DENETLENMESİ

ULUSLARARASI HABER RAPORLARININ RAPOR İÇERİKLERİNDE KULLANILAN İFADELERE GÖRE MAKİNE ÖĞRENMESİ YÖNTEMİYLE SINIFLANDIRILMASI VE DENETLENMESİ

Rapor verisinin miktarının çok olması durumunda giderek artan veri yoğunluğu içinde tasnifi ve arşivlenmesine yönelik işlemlerin yapılması zordur. Bu zorluğun aşılması, raporların denetlenmesi, düzenlenmesi ve düzeltilmesi, Karar Destek Sistemleri yollarından biri olan Makine Öğrenme ile aşılabilir. Raporların analiz edilmesi, anlamsız veriler arasından anlamlı verilerin çıkarılması, verinin kullanımı açısından büyük kolaylık sağlamaktadır. Bu yapılan araştırma, uluslararası yayın yapan büyük bir medya organının çevrimiçi olarak dünya çapında yayınladığı haber ve bilgi raporlarının makine öğrenme algoritmaları kullanılarak sınıflandırılmasına dayanmaktadır. Uygulamanın analiz aşamasında Rastgele Orman Karar Ağacı, ZeroR, Naif Bayes yöntemleri kullanılmıştır. Bu yöntemlerin sınıflandırma başarıları birbirleri ile karşılaştırılmıştır. Bunlar arasında en iyi sonuçları veren algoritma Rastgele Orman Karar Ağacı yönteminin dayandığı algoritmada parametrik değişiklikler ve düzenlemeler yapılması sonucu rapor sınıflandırmada sonuçlarda yüksek iyileştirmeler elde edilmiştir. Başarı oranı %91’e ve performans süresi 0.47s’e çıkmıştır. Araştırmadaki veri seti içerisinde her birinden 600 rapor olacak şekilde üç adet sınıf, uluslararası konularda raporlar, spor raporları, dergi (magazin) raporlarıdır. Veri setinin bir kısmı eğitim ve bir kısmı test kümesi olarak kullanılmış, 10-katlı çapraz doğrulama yöntemi ile algoritmik doğruluklar denetlenmiştir. Bu sayede, veri seti, hem test hem de eğitim kümesi olarak kullanılmıştır. Derleme ortamı olarak Weka veri madenciliği yazılımı kullanılmıştır.

___

  • Abidin, S., Öztürk, Ö. ve Öztürk, T.Ö. (2017). Klasik Türk Müziğinde Makam Tanıma İçin Veri Madenciliği Kullanımı. Gazi Üniversitesi Mühendislik, Mimarlık Fakültesi Dergisi, 32(4), 1221-1232.
  • Akın, Z.O. (2010). Uluslararası Haber Ajanslarının Türkiye Haberlerinde Eşik Bekçiliği Uygulamaları: Reuters ve Ap Örneği. Yüksek Lisans Tezi, Gazi Üniversitesi Sosyal Bilimler Enstitüsü, Ankara, Türkiye.
  • Aslan, M. (2016). Derinlik Kamerası İle Yaşlılarda Düşme Tespiti. Doktora Tezi, Fırat Üniversitesi Fen Bilimleri Enstitüsü, Elazığ, Türkiye.
  • Aydın, S. (2007). Veri Madenciliği ve Anadolu Üniversitesi Uzaktan Eğitim Sisteminde Bir Uygulama. Doktora Tezi, Anadolu Üniversitesi Sosyal Bilimler Enstitüsü, Eskişehir, Türkiye.
  • Çalış, K., Gazdağı, O. ve Yıldız, O. (2013). Reklam İçerikli Epostaların Metin Madenciliği Yöntemleri ile Otomatik Tespiti. Bilişim Teknolojileri Dergisi, 6(1), 1-7.
  • Ertuğrul, İ., Organ, A. ve Şavlı, A. (2012). Veri Madenciliği Uygulamasına İlişkin PAÜ Hastanesinde Hasta Profilinin Belirlenmesi. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi, 19(2), 97-103.
  • Hazım, L.R. (2018). Four Classification Methods Naïve Bayesian, Support Vector Machine, K-Nearest Neighbors and Random Forest Are Tested For Credit Card Fraud Detection. Yükseklisans Tezi, Altınbaş Üniversitesi, İstanbul, Türkiye.
  • Jivani, A.G. (2011). A Comparative Study of Stemming Algorithms. International Journal of Computer Science, 2(6), 1930-1938.
  • Kalaycı, T.E. (2018). Kimlik hırsızı web sitelerinin sınıflandırılması için makine öğrenmesi yöntemlerinin karşılaştırılması. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi, 5(24), 870-878.
  • Karakoyun, M. ve Hacıbeyoğlu, M. (2014). Biyomedikal Veri Kümeleri İle Makine Öğrenmesi Sınıflandırma Algoritmalarının İstatistiksel Olarak Karşılaştırılması. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Mühendislik Bilimleri Dergisi, 16(48), 30-41.
  • Karasoy, O. ve Ballı, S. (2016). İçerik Tabanlı İstenmeyen SMS Filtreleme için Mobil Uygulama Geliştirilmesi ve Sınıflandırma Algoritmalarının Karşılaştırılması. Konferans bildirisi. International Artificial Intelligence and Data Processing Symposium (IDAP'16).
  • Kılınç, C., Bozyiğit, .F, Özçitf, A., Yücelar, F. ve Borandağ, E. (2011). Metin Madenciliği Kullanılarak Yazılım Kullanımına Dair Bulguların Elde Edilmesi. Konferans bildirisi. Celal Bayar Üniversitesi Hasan Ferdi Turgutlu Teknoloji Fakültesi Yazılım Mühendisliği Bölümü, Manisa, Türkiye, Ekim.
  • Kılınç, D., Borandağ, E., Yücalar, F., Tunalı, V., Şimşek, M. ve Özçift, A. (2016). KNN Algoritması ve R Dili ile Metin Madenciliği Kullanılarak Bilimsel Makale Tasnifi. Marmara Fen Bilimleri Dergisi, 3, 89-94.
  • Kılınç Kan, B. ve Yazarlı, Y. (2018). İstatistik Kitaplarının Metin Madenciliği Yöntemleri Kullanılarak Yazarlarının Eğitimine Göre Sınıflandırılması. Turkiye Klinikleri J Biostat, 3(10), 215-223.
  • Nasa, C. ve Suman (2012). Evaluation of Different Classification Techniques for WEB Data. International Journal of Computer Applications, 52(9), 35-40.
  • Özdarıcı O.K., Akar, Ö. & Güngör, O. (2011). Rastgele Orman Sınıflandırma Yöntemi Yardımıyla Tarım Alanlarındaki ürün Çeşitliliğinin Sınıflandırılması. Konferans bildirisi. ODTÜ, Jeodezi ve Coğrafi Bilgi Teknolojileri EABD, Ankara, Türkiye, Ocak.
  • Pervan, N. (2019). Derin Öğrenme Yaklaşımları Kullanarak Türkçe Metinlerden Anlamsal Çıkarım Yapma. Yüksek Lisans Tezi, Ankara Üniversitesi Fen Bilimleri Enstitüsü, Ankara, Türkiye.
  • Tantuğ, A.C. (2012). Metin Sınıflandırma. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Dergisi, 6(6), 1-12.
  • Tekin, M.C. (2018). Yazılım Geliştirme Taleplerinin Metin Madenciliği İle Sınıflandırılması ve Önceliklendirilmesi. Yüksek Lisans Tezi, Maltepe Üniversitesi Fen Bilimleri Enstitüsü, Maltepe, İstanbul.
  • Ünal, D.İ. ve Şeker, ŞE (2018). Metin Madenciliğinde Yazar Tanıma. YBS Ansiklopedisi, 5(1), 1-6.
  • Vijayarani, S., Ilamathi, J. ve Nitya (2014). Preprocessing Techniques for Text Mining - An Overview. International Journal of Computer Science, 5(1), 7-16.
  • Yıldız, B. ve Ağdeniz, Ş. (2018). Muhasebe Analiz Yöntemi Olarak Metin Madenciliği. Muhasebe Bilim Dünya Dergisi, 2(20), 286-315.
  • Yıldız, M. ve Şeker, Ş.E. (2016). Veri Madenciliği Araçları (Data Mining Tools). YBS Ansiklopedi, 3(4), 10-19.