Doğal Dil İşleme Uygulamaları İçin Türkçe Veri Seti Oluşturulması

Bu çalışma cümleden anlam çıkarılması ve Türkçe metinlerin çizge veri yapısında temsil edilmesi ile ilgili yaklaşımları ele almaktadır.İnsanların makinelerle etkileşiminin giderek artmasıyla, makinelerin de insanlar gibi davranışlar göstermesi giderek önem kazanmaktadır.Böylece makineler insanlara daha fazla yardımcı olabilecektir.İnsana ait en karakteristik davranışlardan birisi de konuşabilmektir.Konuşmanın en temel yapı taşlarından birisi de cümlelerdir.Makineler insanların konuştukları cümleleri anlamlandırabilirse tahminleme, makinelerin kişisel asistanlığı gibi konularda büyük ilerleme kaydedilecektir. Metinlerin SQL veritabanı yerine çizge veritabanı üzerinde temsili ise, metinlerin analizinde kullanıcılara hız kazandıracaktır.SQL vetitabanında kütle halinde kaydedilmiş içerikler yerine, Neo4j  veritabanında çizge veriyapısında kaydedilmiş içerikleri analiz etmek daha hızlı ve daha basittir.Ayrıca bu yaklaşım arama motoru altyapısı ve konuşma robotu altyapısı gibi konulara da öncülük edebilecektir.

___

  • [1] google assistant, https://assistant.google.com/intl/tr_tr/platforms/phones/ , Son erişim haziran 2019[2] Cebiroğlu G, 2013 , http://tools.nlp.itu.edu.tr/Tokenizer , Son erişim Haziran 2019[3] Delibaş, A. (2008, haziran). Doğal Dil İşleme İle Türkçe Yazım Hatalarının Denetlenmesi. Yüksek Lisans Tezi. İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü,İstanbul,Türkiye, 35-36[4] Cebirğolu, G. (2002). Sözlüksüz Köke Ulaşma Yöntemi. İstanbul Teknik Üniversitesi. Yüksek Lisans Tezi. İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü,İstanbul,Türkiye, 1-2[5] Bilgin M., Amasyali M.F. (2016). Bileşik Cümlelerde Yan Cümleciklerin Otomatik Etiketlenmesi. 18. Akademik Bilisim Konferansı, AYDIN, TÜRKIYE, 3-5 Şubat 2016, cilt.1, ss.1-4[6] Lafferty, J., McCallum, A. ve Pereira, F. (2001). Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data. International Conference on Machine Learning (ICML), 28 June-1 July 2001, Massachusetts.[7] Eliaçık, A., Erdoğan, N. (2015). Mikro Bloglardaki Finans Toplulukları için KullanıcıAğırlıklandırılmış Duygu Analizi Yöntemi .UYMS, 782-793[8] Yurtay, Y. , Ak G., Bacınoğlu ,N,Z. (2013) . Tıbbi Karar Destek Sistemlerinin Yöntemsel Olarak Değerlendirilmesi Üzerine Bir Çalışma. ISITES2013 International Symposium On Innovate Technologies In Engineering Science,901-910 [9] Seker, S,E.(2015). Sosyal Ağlarda Veri Madenciliği (Data Mining on Social Networks). YBS Ansiklopedi, 2(2), 30-39[10] A, Akçataş. (2007). Türkiye Türkçesinde yapı, işlev ve anlam ilişkileri açısından cümle grupları ve cümle türleri üzerinde bir deneme II. Türk Dili Araştırmaları Yıllığı – Belleten,55(2007/2), 7-14 [11] neo4j, https://neo4j.com/ ,Son erişim haziran 2019[12] cypher, https://neo4j.com/developer/cypher-query-language/ , Son erişim haziran 2019[13] Agan, C., Diri, B.(2016). Türkçe Derlemler İçinSöz Dizimsel Görselleştirme ve Sorgulama Aracı . Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 9(1) , 1-10[14] Karagöz G,N. , Komesli M.(2017). Çizge Veri Tabanı Kullanılarak Geliştirilen Yazılım Lisans Yönetimi Amaçlı Veri Görselleştirmesi Uygulaması: BigLogVis. Dokuz Eylül Üniversitesi-Mühendislik Fakültesi Fen ve Mühendislik Dergisi, 19(57), 779-789 [15] neo4j, https://neo4j.com/news/how-much-faster-is-a-graph-database-really/ , Son erişim haziran 2019