ENTROPİ YAKLAŞIMIYLA TÜRK LEHÇELERİ ÜZERİNDE METİNLERARASI BİR KARŞILAŞTIRMA

Çok eski bir kavram olan Entropi ilk olarak termodinamikte 19. Yüzyılın ortalarına doğru Clausius tarafından geliştirilmiştir. Termodinamikteki ya da istatistiksel mekanikte entropi bir termodinamiksel sistemde var olan düzensizlik düzeyinin bir ölçümüdür. Günümüzde entropi optimizasyon metotları, istatistik, matematik, coğrafya, uzay bilimleri, ekonomi, finans, pazarlama, sistem analizi, görüntü işleme, model belirleme gibi alanlarda önemli uygulamalara sahiptir. Ayrıca literatürde, farklı dillerin birbirlerine göre üstünlüklerinin karşılaştırıldığı birçok çalışmaya da rastlanabilir. Türk dili alanında rastlamadığımız bu tür çalışmalar, bu alanda bir boşluğu dolduracaktır kanaatindeyiz. Dile sayısal bir yaklaşım amacıyla, Entropi alanının metotlarıyla gerçekleştirdiğimiz bu çalışmada, aynı düşünceyi ifade eden Göktürkçe (asıl metin), Türkiye Türkçesi (çeviri), Kırgız Türkçesi (çeviri), Kazak Türkçesi (çeviri) metinler dil özellikleri bakımından istatistik biliminde önemli bir yere sahip olan Entropi yaklaşımı ile metinlerarası bir karşılaştırılmaya tâbî tutulmuştur. Çalışmada karşılaştırmayı gerçekleştirmek için MATLAB yazılımından yararlanılmış ve çalışmanın Türk dili alan uzmanları açısından daha anlaşılır olmasını sağlamak amacıyla bir örnek uygulama da yapılmıştır. Orhun abidelerindeki metinler ile, Kırgız Türkçesi ve Kazak Türkçesi gerçekleştirilmiştir. Çalışmanın uygulama kısmında Göktürkçe, Türkiye Türkçesi, Kazak Türkçesi ve Kırgız Türkçesi lehçelerinde aynı metinlerin birbirine çevirileri kullanılmış ve MATLAB paket programı yardımı ile her bir metnin Entropisi hesaplanarak tablolarda gösterilmiştir. Çalışmanın uygulama kısmında kullanılan metin, daha önceden sisteme girilen herhangi bir metnin entropisini hesaplayan bir program aracılığı ile analiz edilerek ilgili sonuçlara ulaşılmıştır. Ek 1. verilen herhangi bir metnin entrpisini hesaplamak için MATLAB kodlarını içermektedir. Dileyen bir araştırmacı bu yazılımı elde ettikten sonra kendi metnini girerek bu metnin entropisini hesaplayabilir

INTERTEXTUAL COMPARISON OF TURKISH DIALECTS VIA ENTROPY APPROXIMATION

Entropy, a very old term, was developed by Clausius in thermodynamics toward the middle of the 19th century. In thermodynamics or statistical mechanics, entropy is the measure of the level of the existing disorder in a thermo-dynamical system. Today, entropy optimization methods has important applications in the fields such as statistics, mathematics, geography, space sciences, economics, finance, marketing, system analysis, image processing, and model selecting. Furthermore, literature has many works which compare superiority of different languages. There is no such work in the Turkish language. We believe that such future works in the field will fill this gap. Using entropy methods, the present work compares the Göktürk language (the original text), Turkish (translation), Kyrgyz (translation) and Kazakh (translation) in terms of their language characteristics. The MATLAB software was used. An example application was conducted in order to enable the work to be more understandable for the experts working in the field of the Turkish language. Entropy between the texts in the Orkhon inscriptions and their Kyrgyz and Kazakh translations was done. The work used the mutual translations of the same text in the Göktürk language, Turkish, Kazakh and Kyrgyz. Entropy of each text was calculated by the MATLAB software and shown in the tables. The results were obtained by analyzing the text which was used in the application by the program which calculates entropy of any text which was previously entered in the system. The appendix 1 includes the MATLAB codes to calculate eny given text. Any researchers can calculate the entropy of their text through the software by entering their own text

___

  • ATLI E., (1972), Yazılı Türkçede Bazı Enformatik Bulgular, Uygulamalı Bilimlerde Sayısal Elektronik Hesap Makinalarının Kullanılması, 409-425, TBTK, Ankara.
  • BAZILHAN, N., Kazakstan Tarihı Turalı Türki Derektemeleri (2005), R. B. Süleymanov Doğu Bilimleri Enstitüsü Yayınları, Almatı, Kazakistan.
  • ÇIÇEK, H. (2013), Maksimum Entropi Yöntemi İle Türkiye’deki Coğrafi Bölgelerin Yıllık Hava Sıcaklık Değerlerinin İncelenmesi, Yüksek Lisans Tezi, Afyon Kocatepe Üniversitesi, Fen Bilimleri Enstitüsü, Afyonkarahisar.
  • ERGIN, M., (1999), Orhun Abideleri, Boğaziçi Yay., İstanbul.
  • GÖNENÇ G., (1976) Doğal Diller alanında Bilgisayar kullanımı, Bilişim’76 Bildiriler, Türkiye Bilişim Derneği Yayınları, 3(28.1-28.10).
  • KANTAR M. Y. (2006). Entropi Optimizasyon Metotlarıyla Rassal Değişkenlerin Dağılımlarının İncelenmesi, Doktora Tezi, Anadolu Üniversitesi, Fen Bilimleri Enstitüsü, Eskişehir.
  • PIERCE, J.(1963), Türkçe Kelime Sayımı – A Frequency Count of Turkish Words, Milli Eğitim Bakanlığı Yayım Müdürlüğü, Ankara.
  • SIDIKOV, S., KADIRALI, K., Bayırkı Türk Cazuusu VII-X asırlar (Eski Türk Yazısı), Bişkek, 2001.
  • TÖRECI E.,(1974), Statistical Investigation on the Turkish Language Using Digital Computers, Yüksek Lisans Tezi, ODTÜ Elektrik Mühendisliği Bölümü, Ankara.
  • DSOUZA, C., (2012). Compute the Entropy of an entered text string, (Source: http://www.mathworks.com/matlabcentral/fileexchange/38295-compute-the-entropy-of-anentered-text-string)
  • TÖRECI, E.,(1978), Özdevimsel Olarak Türetilen Türkçe Metin Örnekleri, Bilişim’78 Bildiriler, 166-174, Ankara.
  • WU X. (2003). Calculation of Nex-Entropy Densities with Application to Income Distribution, Journal of Econometrics 115: 347-354.
  • YOLAÇAN Ş. (2005), Farklı Dillerin Entropi ve İnformasyon Teorisi Açısından İstatistiksel Özellikleri, Yüksek Lisans Tezi, Anadolu Üniversitesi Fen Bilimleri Enstitüsü, Eskişehir.