Tweetlerin Duygu Analizi İçin Hibrit Bir Yaklaşım
Sosyal medyada ifade edilen görüşler, çeşitli işletmeler için her zaman dikkate alınan ve faydalı bir kaynak olmuştur. Duygu analizi, kullanıcılar tarafından oluşturulan içeriği belirli kutuplara (pozitif, negatif) etkin bir şekilde sınıflandırmayı ifade eden genel bir terimdir. Duyguların sınıflandırma ve analizini gerçekleştirmek için çeşitli araçlar ve teknikler bulunmaktadır. Bunlar, veri üzerinde ön işleme adımları tamamlandıktan sonra hedef grubu sınıflandıran denetimli makine öğrenimi tekniklerini içermektedir. Hibrit araçlar, makine öğrenimi ve sözlük tabanlı algoritmaların birleşimini kullanarak, işaretlenmiş verilere dayalı olarak sınıflandırma yapar. Bu makalede, duyguların analizinde SVM algoritmasını Weka adında açık kaynaklı bir yazılım ile birlikte kullandık. İki önceden kategorize edilmiş tweet veri seti kullanıldı. SVM algoritmasının performansı, analitik metrikler yardımıyla değerlendirildi.
A Hybrid Approach for Sentiment Analysis of Tweets
The views and inputs expressed by the community have always been a crucial and valuable resource for various enterprises. The advent of widespread community media has provided an exceptional opportunity for studying and assessing diverse fields, replacing the peculiar, laborious, and inaccurate approaches that companies used to rely on. This particular type of analysis falls under the subclass of sentence analysis. Sentiment analysis, a broad term, refers to the process of effectively classifying user-generated content into specific polarities. To perform sentiment identification and analysis, a range of tools and techniques are available, including supervised machine learning techniques that classify the target group after training on data. Hybrid instruments, combining machine learning and lexicon-based algorithms, classify content based on annotated dictionaries. In this study, we employed the Support Vector Machine (SVM) algorithm with Weka, an open-source software, to analyze sentiments. Two pre-categorized datasets of tweets were utilized. The performance of the SVM algorithm was assessed using analytical metrics.
