Türkçe Metinlerde Sözlük Tabanli Yaklaşimla Duygu Analizi Ve Görselleştirme

Metin madenciliği yöntemleri, yapılandırılmamış metinlerden otomatik olarak faydalı bilgilerin çıkarılmasını kolaylaştırmak için önem kazanmaktadır. Bu amaçla kullanılan metin madenciliği yöntemleri ile büyük miktardaki metin verileri, kısa zamanda ve yüksek performans ile analiz edilebilmektedir. Bu çalışmanın temel amacı, kelime sıklığı, bilgi çıkarma, sınıflandırma, veri işleme ve çıkarma gibi araçlarla Türkçe metinlerinin işlenmesi ve görselleştirilmesidir. Metin madenciliği alanlarından biri olan duygu analizi veya fikir madenciliği, görüşler, tutumlar ve duygular gibi öznel bilgilerin algılanmasını otomatikleştirmek için kullanılmaktadır. Bu tezde sunulan çalışmada, sosyal medya paylaşımları, roman, müşteri yorumları gibi Türkçe metinlerin analizine ihtiyaç duyulduğu durumlarda kullanılabilecek yeni bir araç önerilmektedir. Geliştirilen uygulama esas olarak duygu analizi yaparken "kelime düzeyinde" çalışmaktadır. Buna ek olarak, duygu analizinde kullanılan sözlük sıfatlar, isimler, fiiller, zarflar, ön ekler, son ekler türünde kelimeler içermektedir. Kullanılan birinci sözlük 5.000 kelime, ikinci ve üçüncü sözlük yaklaşık 25.000 kelime içermektedir. Geliştirilen iki yöntemle üç farklı veri seti üzerinde deneyler yapılmıştır. Birinci yöntem bu veri setlerinde sırasıyla %77,14, %72,78 ve %74,17 doğruluk oranına ulaşmıştır. İkinci yöntem ise aynı veri setleri üzerinde sırasıyla %82,85, %74,92 ve %77,50 doğruluk oranına erişmiştir. Yapılan deneysel çalışmaların sonuçları incelendiğinde  sistemin hatalı karar verdiği cümleler incelendiğinde hatalı yazılan kelimeler, kinayeli yorumlar, art niyetli yazılmış yorumlar, bazı deyimlerin ve kelimelerin birden fazla anlamının olması, karşılaştırma içeren cümlelerin bir taraf için olumlu duygu taşırken diğer taraf için olumsuz duygu taşıması gibi durumların hatalı tespit işleminde etkin olduğu gözlemlenmiştir.Bu çalışmanın temel amacı,  kelime sıklığı, bilgi çıkarma, sınıflandırma, makine öğrenmesi, veri işleme ve çıkarma gibi araçlarla Türkçe metinlerinin işlenmesi ve görselleştirilmesidir.

___

  • [1] Simon Kemp, report author , Digital around the world in 2019, the essential line data you need to understand global mobile, internet, and social media use P7. https://wearesocial.com/global-digital-report-2019 .
  • [2] Dr. Cebrail Taşkın, MBA Chief Technology Officer (CTO) & Chief Digital Officer, YENİ DEĞER: BÜYÜK VERİ, 2017 https://www.linkedin.com/pulse/yeni-de%C4%9Fer-b%C3%BCy%C3%BCk-veri-dr-cebrail-ta%C5%9Fk%C4%B1n-mba?articleId=6328625124677341184#comments-6328625124677341184&trk=public_profile_post
  • [3] Simon Kemp, report author, Digital around the world in 2019, the essential line data you need to understand global mobile, internet, and social media use, we are social 2019 report for Turkey https://wearesocial.com/global-digital-report-2019
  • [4] www.marketingturkiye.com.tr, haberler, 2017 rakamlar, Türkiye’de e-ticaret istatistikleri https://www.marketingturkiye.com.tr/haberler/rakamlarla-2017-turkiye-e-ticaret-istatistikleri/.
  • [5] Akcayol, M & Özyurt, Barış. (2018). FİKİR MADENCİLİĞİ VE DUYGU ANALİZİ, YAKLAŞIMLAR, YÖNTEMLER ÜZERİNE BİR ARAŞTIRMA. Selcuk University Journal of Engineering ,Science and Technology. 6. 668-693. 10.15317/Scitech.2018.160.
  • [6] Abbé, Adeline. Analyse de données textuelles d'un forum médical pour évaluer le ressenti exprimé par les internautes au sujet des antidépresseurs et des anxyolitiques. Diss. Paris Saclay, 2016.
  • [7] Stubbs M. Text and corpus analysis: Computer-assisted studies of language and culture. Blackwell Oxford; 1996.
  • [8] Roche E, Schabes Y. Finite-state Language Processing. 1997. (MIT Press).
  • [9] Kononenko I, Kukar M. Machine learning and data mining: introduction to principles and algorithms. Horwood Publishing; 2007.
  • [10] O'Dea B, Wan S, Batterham PJ, Calear AL, Paris C, Christensen H. Detecting suicidality on Twitter. Internet Interv 2015 May;2(2): 183-8.