Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi

Metin madenciliği, doğal dil metninde yer alan yapılandırılmamış (metin) verilerin çeşitli yöntem, araç ve tekniklerin kullanılarak analiz edilmesidir. Bugün, kurum ve kuruluşların çoğu, veri ambarlarında ve bulut platformlarında büyük miktarda veri toplamakta ve depolamaktadır. Bu veriler, birden fazla kaynaktan gelen yeni verilerin gelmesiyle birlikte, üssel olarak artmaya devam etmektedir. Şirketlerin ve kuruluşların geleneksel araçlarla büyük miktardaki metin verilerini depolaması, işlemesi ve analiz etmesi zordur. Bugün, gelişen Tableau gibi yazılımlar sayesinde bu problemler ortadan kalkmıştır. Bu çalışmanın amacı; metin madenciliği yöntemi ile Shakespeare eserlerindeki kahramanları ve olay örgülerini istatistiksel olarak saptamak ve edebiyat alanında çalışanlara bazı öngörüler sağlamaktır. Bu amaçla çalışmada, Tableau yazılımı kullanılarak Google BigQuery’nin alt yapısında bulunan Shakespeare veri setine kelime frekansları, görselleştirme ve kümeleme analiz yöntemi uygulanmıştır. Kümeleme analizi sonucunda “Hamlet” kelimesinin tüm eserlerin merkezinde yer aldığı ve Hamlet’in Shakespeare’in en önemli eseri olduğu bulunmuştur. Ayrıca, “Romeo ve Juliet” eserinde sırasıyla; “Romeo”, “Juliet” ve “Love” en çok kullanılan kelimeler olarak bulunmuştur. Elde edilen bu bulgulardan eserin ana karakterlerinin “Romeo” ve “Juliet”, konusunun ise “aşk” olduğu sonucuna varılmıştır.  

___

  • Arslan, H., Kaynar, O., & Yüksek, A. G. (2015). Kurumsal Kolektif Süreçler için E-Posta İletilerinden Görev Keşfi ve Gerçek Zamanlı Görev Yönetim Sisteminin Geliştirilmesi. Bilişim Teknolojileri Dergisi, 10(4), 381-388.
  • Azzalini, A., & Scarpa, B. (2012). Data analysis and data mining: An introduction. OUP USA.
  • Bose, B. (2018). Techniques and Aplications of Text Mining. https://www.digitalvidya.com/blog/techniques-applications-text-mining/, (Erişim Tarihi: 10.06.2018).
  • Bozyiğit, F. (2015). Analyzing source code and detecting similarities, M.Sc Thesis, Dokuz Eylül University, Izmir.
  • Coursehero (2019). Terim frekanı tf bir doküman içerisinde bir. https://www.coursehero.com/file/p14lar0/Terim-Frekans, (Erişim Tarihi: 20.01.2019).
  • Delibaş, A., (2008). Doğal Dil İşleme İle Türkçe Yazım Hatalarının Denetlenmesi, Yüksek Lisans Tezi, İstanbul Teknik Üniversitesi, İstanbul, Türkiye.
  • Dinçer, E. (2006). Veri Madenciliğinde K-Means Algoritması ve Tıp Alanında Uygulanması, Yüksek Lisans Tezi, Kocaeli Üniversitesi, Fen Bilimleri Enstitüsü, Kocaeli, 101s.
  • Dolgun, M. Ö., Özdemir, T. G., & Oğuz, D. (2009). Veri madenciliğiâ nde yapısal olmayan verinin analizi: Metin ve web madenciliği. İstatistikçiler Dergisi: İstatistik ve Aktüerya, 2(2), 48-58.
  • Evans, S., Lioyd, J., Stoddard, G., Nekeber, J., Samone, M. 2005. Risk Factors For Adverse Drug Events. The Annals of Pharmacotherapy, 39, 1161-1168.
  • Gaikwad, S. V., Chaugule, A., & Patil, P. (2014). Text mining methods and techniques. International Journal of Computer Applications, 85(17).
  • Hotho, A., Nürnberger, A., & Paaß, G. (2005, May). A brief survey of text mining. In Ldv Forum (Vol. 20, No. 1, pp. 19-62).
  • Işık, M. (2006). Bölünmeli kümeleme yöntemleri ile veri madenciliği uygulamaları. Y. Lisans Tezi, Fen Bilimleri Enstitüsü, Marmara Üniversitesi, İstanbul.
  • İlhan, S., Duru, N., Karagöz, Ş., & Sağır, M. (2008). Metin Madenciliği ile Soru Cevaplama Sistemi. Elektronik ve Bilgisayar Mühendisliği Sempozyumu (ELECO), Bursa, 26-30.
  • Jain, A. K., Murty, M. N., & Flynni, P. J. (1999). Data clustering: a review. ACM computing surveys (CSUR), 31(3), 264-323.
  • Kaşıkçı, T., & Gökçen, H. (2014). Metin Madenciliği İle E-Ticaret Sitelerinin Belirlenmesi. Bilişim Teknolojileri Dergisi, 7(1).
  • Kılınç, D., Borandağ, E., Yücalar, F., Tunalı, V., Şimşek, M., & Özçift, A. (2016). KNN algoritması ve r dili ile metin madenciliği kullanılarak bilimsel makale tasnifi. DOI: 10.7240/mufbed.69674
  • Linguamatics (2018). What is NLP Text Mining?. https://www.linguamatics.com/what-is-text-mining-nlp-machine-learning, (Erişim Tarihi: 20.12.2018).
  • Mane, S. (2018). What are the application of text mining?. https://www.quora.com/What-are-the-applications-of-text-mining/answer/Sayali-Mane-16, (Erişim Tarihi: 23.04.2018).
  • Maria, L. (2018). Understanding and Writing your first Text Mining Script with R. https://towardsdatascience.com/understanding-and-writing-your-first-text-mining-script-with-r-c74a7efbe30f, (Erişim Tarihi: 11.01.2018).
  • Padhy, N., Mishra, D., & Panigrahi, R. (2012). The survey of data mining applications and feature scope. arXiv preprint arXiv:1211.5723.
  • Pat Reserch (2018). Top Free Software for Text Analysis Text Mining Text Analytics. https://www.predictiveanalyticstoday.com/top-free-software-for-text-analysis-text-mining-text-analytics/, (Erişim Tarihi: 10.12.2018).
  • Port (2018). An introduction to text mining. https://port.sas.ac.uk/mod/book/view.php?id=554&chapterid=325, (Erişim Tarihi: 22.12.2018).
  • Rouse, M. (2018). Text mining (text Analytics). https://searchbusinessanalytics.techtarget.com/definition/text-mining, (Erişim Tarihi: 20.12.2018).
  • Rai, A. (2018). What is Text Mining: Techniques and Applications. https://www.upgrad.com/blog/what-is-text-mining-techniques-and-applications/, (Erişim Tarihi: 13.06.2018).
  • Seker, S. E., Mert, C., Al-Naami, K., Ozalp, N., & Ayan, U. (2013). Correlation between the economy news and stock market in Turkey. International Journal of Business Intelligence Research (IJBIR), 4(4), 1-21.
  • Seker, S. E. (2015). Metin Madenciliği (Text Mining). YBS Ansiklopedi, 2(3), 30-32.
  • Sagayam, R., Sriniyasan, S., & Roshni, S. (2012). A survey of text mining: Retrieval, extraction and indexing techniques. International Journal of Computational Engineering Research, 2(5), 1443.
  • Tableau (2018). Find Cluster in Data. https://onlinehelp.tableau.com/v2018.3/pro/desktop/en-us/clustering.htm#HowItWorks, (Erişim Tarihi: 25.12.2018).
  • Talib, R., Hanif, M. K., Ayesha, S., & Fatima, F. (2016). Text mining: techniques, applications and issues. International Journal of Advanced Computer Science and Applications, 7(11), 414-418.
  • Weiss, S. M., Indurkhya, N., Zhang, T., & Damerau, F. (2010). Text mining: predictive methods for analyzing unstructured information. Springer Science & Business Media.
  • Williams, J. (2018). 9 Best Applications of Text Data Mining and Analysisis. https://www.promptcloud.com/blog/9-best-examples-of-text-mining-analysis, (Erişim Tarihi: 06.08.2018).