Onur SEVLİ, Nazan KEMALOĞLU

Olağandışı Olaylar Hakkındaki Tweet’lerin Gerçek ve Gerçek Dışı Olarak Google BERT Modeli ile Sınıflandırılması

İnsanlar yanlarında taşıyabildikleri internet erişimi olan cihazlar ile gözlemledikleri her tür olağan ya da olağandışı durumu gerçek zamanlı olarak sosyal ağlarda paylaşabilmektedir. Twitter, bu konuda yaygın olarak kullanılan ve pek çok olağandışı durumun ilk duyulduğu sosyal ağlardandır. Bu anlamda acil müdahale ekipleri ve medya şirketleri için popüler bir haber kaynağıdır. Ancak yapılan paylaşımların her zaman gerçek bir olağan dışı durumu belirttiği açık değildir. Doğal dil işleme, insanların konuştukları dillerin makineler tarafından yorumlanabilmesine olanak tanır. Google BERT modeli, iki yönlü olarak kelimeler ve cümleler arasındaki bağlamsal ilişkileri yapay sinir ağları temelinde etkin bir şekilde ortaya koyan bir doğal dil işleme modeldir. Gerçekleştirilen çalışmada deprem, kaza, olumsuz hava olayları gibi felaket durumları hakkında atılan 7613 adet gerçek veya gerçek dışı olarak etiketlenmiş tweet içeren veri seti Bert modeli kullanılarak sınıflanmıştır. Gerçekleştirilen eğitim süreci sonunda %98.8 doğruluk elde edilmiştir.

Anahtar Kelimeler:

Twitter veri analizi, Makine Öğrenmesi, Doğal Dil İşleme, Google BERT

PDF

___

“Digital 2020: Global Digital Overview,” DataReportal – Global Digital Insights. https://datareportal.com/reports/digital-2020-global-digital-overview (accessed May 10, 2020).
“Twitter by the Numbers (2020): Stats, Demographics & Fun Facts,” Jan. 05, 2020. https://www.omnicoreagency.com/twitter-statistics/ (accessed May 13, 2020).
A. Bruns, T. Highfield, and J. Burgess, “The Arab Spring and social media audiences: English and Arabic Twitter users and their networks,” American behavioral scientist, vol. 57, no. 7, pp. 871–898, 2013.
T. Terpstra, A. De Vries, R. Stronkman, and G. L. Paradies, Towards a realtime Twitter analysis during crises for operational crisis management. Simon Fraser University Burnaby, 2012.
F. Cheong and C. Cheong, “Social media data mining: A social network analysis of tweets during the Australian 2010-2011 floods,” in 15th Pacific Asia Conference on Information Systems (PACIS), 2011, pp. 1–16.
B. Mandel, A. Culotta, J. Boulahanis, D. Stark, B. Lewis, and J. Rodrigue, “A demographic analysis of online sentiment during hurricane irene,” in Proceedings of the second workshop on language in social media, 2012, pp. 27–36.
C. Caragea, A. Squicciarini, S. Stehle, K. Neppalli, and A. Tapia, “Mapping moods: Geo-mapped sentiment analysis during hurricane sandy,” pp. 642–651, Jan. 2014.
H. Li et al., “Twitter mining for disaster response: A domain adaptation approach,” Jan. 2015.
M. Imran, S. Elbassuoni, C. Castillo, F. Diaz, and P. Meier, Extracting Information Nuggets from Disaster- Related Messages in Social Media. 2013.
Z. Ashktorab, C. Brown, M. Nandi, and A. Culotta, “Tweedr: Mining twitter to inform disaster response.,” in ISCRAM, 2014.
K. Kireyev, L. Palen, and K. Anderson, “Applications of topics models to analysis of disaster-related twitter data,” in NIPS workshop on applications for topic models: text and beyond, 2009, vol. 1.
S. Vieweg, A. L. Hughes, K. Starbird, and L. Palen, “Microblogging during two natural hazards events: what twitter may contribute to situational awareness,” in Proceedings of the SIGCHI conference on human factors in computing systems, 2010, pp. 1079–1088.
S. Kumar, G. Barbier, M. A. Abbasi, and H. Liu, “Tweettracker: An analysis tool for humanitarian and disaster relief,” in Fifth international AAAI conference on weblogs and social media, 2011.
G. G. Chowdhury, “Natural language processing,” Annual review of information science and technology, vol. 37, no. 1, pp. 51–89, 2003.
J. Devlin, M.-W. Chang, K. Lee, and K. Toutanova, “Bert: Pre-training of deep bidirectional transformers for language understanding,” arXiv preprint arXiv:1810.04805, 2018.
K. Schachinger, “A Complete Guide to the Google RankBrain Algorithm,” Search Engine Journal, 2017.