Büyük Veri Kavramı ile İlgili Akademik Yayınların Metin Madenciliği Yöntemi ile Analizi

Büyük veri son yıllarda büyük popülerlik kazanan çalışma alanlarından biridir. Walmart, Netflix, Shell, gibi bir çok firma büyük veri labarotuvarları kurarak ellerindeki verileri işlemekte ve elde ettikleri sonuçları planlamalarında kullanmaktadırlar. Beş kriteri bulunan bu çalışma alanında, en fazla bilinen kriter boyut kavramıdır. Daha sonra boyut kavramına, hız ve çeşitlilik kavramları eklenmiştir. En son olarak ise değer ve doğruluk kavramları dahil edilerek büyük veri kriterleri son halini almıştır. Bu çalışmada büyük veri üzerine yapılan akademik yayınlar incelenmiştir. Bu kapsamda, Science Citation Index Expanded, Social Science Citation Index ve Emerging Science Citation Index içerisinde yer alan dergiler göz önünde bulundurulmuştır. Bu dergiler içerisinde, başlık bilgisinde büyük veri kavramı geçen son 5 yıla ait 3868 adet ingilizce makalelerin tüm bilgileri Web of Science Core Collection veritabanından elde edilmiştir. İlk olarak en fazla yayın yapan ülkeler ile aralarındaki ilişkiler, daha sonra, ilgili alandaki yazarlar ile ilişkileri ve son olarak da makalelerin içerisindeki anahtar kelimeye göre öne çıkan terimler incelenmiş ve analiz edilmiştir. Bu işlemler sırasında iki programdan yararlanılmıştır. Verilerin birleştirilmesinde, indirgenmesinde ve temizlenmesinde BibExcel, verilerin ilişki haritalarının oluşturulmasında ve görselleştirilmesinde ise VosViewer programlarından yararlanılmıştır.

Analyzing Academic Papers Related to Big Data Concept by Text Mining

The concept of big data is one of the areas that gained great popularity in recent years. Many companies, such as Walmart, Netflix, Shell, have established big data labs for processing their data and using the results they have obtained in their planning. Big data has five criteria and the volume is the most known among them Then, the concept of speed and diversity had been added over this concept. Finally, the concept of value and accuracy was added and the concept was finalized. In this study, academic publications on big data were examined. In this context, the journals which are inside of Science Citation Index Expanded, Social Science Citation Index and the Emerging Science Citation Index are taken consideration. In this journals, all the information of 3868 articles in English which were published in last 5 years and passing the big data concept in title information were taken from the Web of Science Core Collection database. Firstly, the relations between countries which publish most articles and then the relations between authors who publish most articles and lastly the most prominent terms according to the keywords in the articles were examined and analyzed. Two programs were used during these operations. Merging, reducing and cleaning of data was done by the help of Bibexcel. Creating relationship maps and visualizations of maps were done by VosViewer.

___

  • [1] İ. Özdemir, Ş. Sağırlıoğlu, “Denetimlerde Büyük Veri Kullanımı Ve Üzerine Bir Değerlendirme”. GU J Sci, Part C, 6(2), 470-480, 2018.
  • [2] Ş. Işıklı,”Büyük Veri, Epistemoloji ve Etik Tartışmalar”, Academic Journal of Information Technology, 9, 2014.
  • [3] N. Gürsakal, Büyük Veri, Dora Yayıncılık, 2013.
  • [4] J. Gantz, D. Reinsel, "Extracting value from chaos", IDC iview, 1142, 1-12, 2011.
  • [5] D. Tellan, “Büyük Veri Türbülansını Yönetmek”, Türkiye Bilişim Derneği 31. Ulusal Bilişim Kurultayı, ISBN: 978-9944-5291-8-1, 41-42, 2014.
  • [6] Y. Gahi, M. Guennoun, H. T. Mouftah, “Big Data Analytics: Security and Privacy Challenges”, 2016 IEEE Symposium on Computers and Communication (ISCC), Messina, Italy, 952-957, 2016.
  • [7] E. Aktan, ''Büyük Veri: Uygulama Alanları, Analitiği ve Güvenlik Boyutu''. Bilgi Yönetimi Dergisi, 3-4, 2018.
  • [8] M. Doğan, Büyük Verinin Kişiler Ve Kurumlar Üzerinde Etkileri, Yüksek Lisans Tezi, İstanbul Bilgi Üniversitesi, Sosyal Bilimler Enstitüsü, 2014.
  • [9] B. Cyganek, M. Grafia, B. Krawczyk, A. Kasprzak, P. Porwik, K. Walkowiak, M. Woźniak, “A Survey of Big Data Issues in Electronic Health Record Analysis”, Applied Artificial Intelligence, 30, 2016.
  • [10] A., Gandomi, M. Haider, “Beyond the Hype: Big Data Concepts, Methods, and Analytics”, International Journal of Information Management, 137-144, (2015).
  • [11] Minelli, M. Chambers, A. Dhiraj, Big Data Big Analytics: Emerging Business Intelligence and Analytic Trends for Today’s Businesses, Hoboken, NJ, U.S.A. Wiley CIO Series, John Wiley & Sons, 2013.
  • [12] F. Ohlhorst, Big Data Analytics Turning Big Data into Big Money, Hoboken, NJ, U.S.A. J. Wiley and SAS Business Series, John Wiley & Sons, 2013.
  • [13] S. Chandra, S. Ray, R. Goswami, Big Data Security: Survey on Frameworks and Algorithms. 2017 IEEE 7th International Advance Computing Conference (IACC),, (s. s.48-54.). Hyderabad, India 2017.
  • [14] Internet: A. Garip, Büyük Veri Kriterleri, https://atacangarip.wordpress.com/2015/08/24/buyuk-veri-bilesenleri/, 10.01.2019.
  • [15] Özköse, H., Arı, E. S., & Gencer, C. (2015). Yesterday, today and tomorrow of big data. Procedia-Social and Behavioral Sciences, 195, 1042-1050.
  • [16] R. Feldman, J. Sanger, The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data, New York: Cambridge University Press, New York USA, 2007.
  • [17] S. Sumathi, S. N. Sivanandam, Introduction to Data Mining and Its Applications, Berlin: Springer-Verlag, 2006.
  • [18] K. Seçkin, Metin Madenciliğinde Kullanılan Yöntemlerin Karşılaştırılması: Siyasi Parti Liderlerinin Grup Genel Toplantı Konuşmaları İle Bir Uygulama, Yüksek Lisans Tezi, Sakarya Üniversitesi, Sosyal Bilimler Enstitüsü, 2011.
  • [19] C. Melek, Metin Madenciliği Teknikleri İle Şirketlerin Vizyon İfadelerinin Analizi, Yüksek Lisans Tezi, Dokuz Eylül Üniversitesi, Sosyal Bilimler Enstitüsü, 2012.
  • [20] A. Güven, Ö. Ö. Bozkurt, O. Kalıpsız, ''Veri Madenciliğinin Geleceği'', Akademik Bilişim, Dumlupınar Üniversitesi, Kütahya