Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi

Son yıllarda bilişim teknolojileri alanındaki gelişmelere bağlı olarak dilleri, bilgisayarlı dilbilim ve doğal dil işleme (DDİ) yöntemleriyle incelemek, çözümlemek ve yapılandırılmış verilere dönüştürmek olanaklı hâle gelmiştir. Türkçenin tarihî dönemleri ile ilgili eş dizimlilik, birliktelik kullanımı, semantik prozodi ve semantik harita çalışmalarının azlığı bizi bu konuları hesaplamalı perspektifle inceleyen bir çalışma yapmaya sevk etmiştir. Araştırmamızda tarihî Türkçe ile yazılmış eserlerde de semantik ağları görüntülemek için münasip kelime hazinesinin mevcut olduğu görülmüştür. İki veya daha çok kelimenin alışkanlıktan kaynaklanan birlikte kullanımları şeklinde tanımlanan eş dizimlilik kavramına göre, bazı kelimeler yalnızca belirli sözcüklerle kullanılma temayülü gösterir. Birlikte sıkça kullanılan kelimeler zamanla aynı çağrışım özelliklerini kazanır, anlam ve biçim bakımından kalıplaşır. Bir biçime eş dizimlilikleri tarafından aşılanan kalıcı istikrarlı anlam aurası ise semantik prozodi olarak tanımlanır. Bu anlam aurası, incelememiz sırasında somut bir şekilde karşımıza çıkmıştır. Çalışmamızda seçilen her kavramın Python programlama dilinde, GraphViz Kütüphanesi ile oluşturulan semantik haritası üzerinde anlam aurası gösterilmiştir. Ayrıca “eş dizimli” ögeleri tespit etmek üzere makine öğrenmesinin bir alanı olan DDİ yöntemlerinden kelime yerleştirme (word embedding/vectorization) ile metin madenciliğinde, makine öğrenmede ve DDİ tekniklerinde yararlanılan GloVe kütüphanesi kullanılarak hazırladığımız yazılım ve Tensor Flow Kelime Yerleştirme Projektörü yazılımı kullanılmıştır. Metinler, bilgisayar ortamına düz metin dosyası (.txt) olarak aktarılmış, metinlerdeki eş dizimli kelime varlığı yazılımlara işlenmiş ve Log-likehood, MI değeri, T-skoru, Dice coefficient değeri gibi farklı istatistik analizleri ile de eş dizimlilikler incelenmiştir. Metinlerdeki eş dizimliliklere ait istatistikleri, kelime sıklıkları, vektörel temsillerinin DDİ’de kullanılan yazılımlar aracılığıyla genel olarak çıkarımları amaçlanmıştır. Sayısallaştırılan metin istatistikî değerleriyle işlenmiş ve ulaşılan veriler görsel olarak gösterilmiştir. Araştırmamız, özellikle Türkçenin tarihî dönem eserlerinin daha iyi anlaşılmasına katkı sağlayacak; eş dizimli yapıların tespiti sayesinde tarihî metinlerde satır arası sözcüklerin anlamlandırılması, anlam auralarının keşfi kolaylıkla yapılabilecektir. Gelişen bilgisayar teknolojileri sayesinde yeni yazılımlar ile anlam haritalarının, sözcüklerin vektörel şemalarının ve anlam auralarının somut gösterimi sağlanacaktır.

___

  • Adalı, E. Türkçe Doğal Dil İşleme. Akçağ Yayınları, 2021.
  • Adalar, D. Anadili Olarak Arapça ve Türkçenin Öğretiminde Kullanılan Metinlerin Karşılaştırılması: Bir Eş Dizimsel Çözümleme Örneği, Ankara Üniversitesi Sosyal Bilimler Enstitüsü, Doğu Dilleri ve Edebiyatları Anabilim Dalı, Yüksek Lisans Tezi, 2004.
  • Aksan, Y. ve Y. Yaldır. Türkçe Sözvarlığının Nicel Betimlemesi, ed. Ç. Sağın Şimşek ve Ç. Hatipoğlu. 24. Ulusal Dilbilim Kurultayı Bildiri Kitabı. ODTÜ Basım İşliği, 2011.
  • Alsarray, M. Türkçe Ulusal Derlemi’nde Yüksek Sıklıkta Kullanılan Adların Eş Dizimliliği, Yıldırım Beyazıt Üniversitesi Sosyal Bilimler Enstitüsü Dilbilim Anabilim Dalı, Yüksek Lisans Tezi, 2015.
  • Ayabakan, M. Türkçe Sözlükte Eş Dizimli Ögelerin Sunumu ve Görünümleri, Ankara Üniversitesi Sosyal Bilimler Enstitüsü Dilbilim Anabilim Dalı, Yüksek Lisans Tezi, 2015.
  • Ayverdi, İ. Misalli Büyük Türkçe Sözlük. Kubbealtı Neşriyatı, 2020.
  • Dönmez, İ. ve E. Adalı. “Türkçe Tümce Çözümlemede Vektör Yaklaşımı.” Afyon Kocatepe Üniversitesi Fen ve Mühendislik Bilimleri Dergisi, no.15, 2015, ss. 1-11.
  • Girgin, M. Süheyl ü Nev-Bahâr’daki Fiillerin Eş Dizim Sözlüğü, Kütahya Dumlupınar Üniversitesi Lisansüstü Eğitim Enstitüsü Türk Dili ve Edebiyatı Anabilim Dalı, Yüksek Lisans Tezi, 2022.
  • Gökdayı, H. Türkçede Öbekler. Kriter Yayınları, 2020.
  • Korkmaz, Z. Dede Korkut Hikayelerinde Dil-Üslup Bağlantısı. TDAY Belleten, no.46, 1998, ss.101–112.
  • Oğuzlar, A. Temel Metin Madenciliği. Dora Yayınları, 2011.
  • Önder, Ş.G. Arap Dilinde Eş Dizim, Marmara Üniversitesi Sosyal Bilimler Enstitüsü Temel İslam Bilimleri Anabilim Dalı, Yüksek Lisans Tezi, 2014.
  • Özçelik, S. Dede Korkut Üzerine Yeni Notlar, Gazi Kitabevi, 2006.
  • Özçelik, S. Dede Korkut -Dresden Nüshası- Giriş-Notlar Türk Dil Kurumu Yayınları, 2016.
  • Özçelik, S. Dede Korkut -Dresden Nüshası- Metin-Dizin Türk Dil Kurumu Yayınları, 2016.
  • Özçelik, S. Dede Korkut -Günbed Yazması- Kazan Bey Oğuznamesi, Ankara: Türk Dil Kurumu Yayınları, 2021.
  • Özkan, B. Türkiye Türkçesinde Belirteçlerle Fiillerin Birlikte Kullanımı ve Eş Dizimliliği-Derlem Tabanlı Bir Uygulama. Türk Dil Kurumu Yayınları, 2011.
  • Pennington, J. ve diğerleri. “GloVe: Global Vectors for Word Representation.” Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2014, ss. 1532-1543.
  • Sankur, B. Otomatik Dil Sınıflandırma ve Türkçe Bilişim Dili. Bilgisayar Destekli Dil Bilimi Çalıştayı Bildirileri. Türk Dil Kurumu Yayınları, 2006.
  • Şeker, S. E. “Doğal Dil İşleme (Natural Language Processing).” YBS Ansiklopedi, no.4, 2015, ss. 14-22.