KUZEYDOĞU TÜRK LEHÇELERİNİN İSTATİSTİKSEL BİR KARŞILAŞTIRMASI

Türk dillerinin ve lehçelerinin sınıflandırılmasında genel olarak Türklerin yaşadığı bölgelerin coğrafi konumlarına ve ses özelliklerine göre yapılmış sınıflandırmalar ön plana çıkmaktadır. Türklerin tarihindeki göçlerin yoğunluğu ve farklı kültürlerle karşı karşıya gelmiş olması, sınıflandırmayı daha da güçleştirmektedir. Kuzeydoğu grubu lehçeleriyle ilgili sınıflandırmalarda Altay, Hakas ve Tuva Türkçeleri yer alırken kimi sınıflandırmalarda bu gruba Yakutça (Sahaca) da katılmakta (bk. Killi, 2002; Özyetgin, 2006 vd.) kimi sınıflandırmalarda ise Halaçça ve Çuvaşça ile birlikte Türk dilinin uzak lehçelerinden sayılmaktadır (bk. Kirişçioğlu, ve ark. 2018). Yine de Yakutçanın bu grupla olan ilişkisinin altı pek çok çalışmada çizilmiştir. Bu çalışmanın iki amacı vardır. İlki; Altay Türkçesi, Hakas Türkçesi, Tuva Türkçesi ve Yakutçanın çeşitli ölçütler açısından karşılaştırılması, ikincisi Altay Türkçesi, Hakas Türkçesi, Tuva Türkçesi ve Yakutça tümceleri ile Türkiye Türkçesi tümceleri arasındaki düzenleme uzaklıklarının hesaplanmasıdır. Bu bağlamda Türk dillerinin sınıflandırılması çalışmalarına disiplinler arası bir katkı sağlamak amaçlanmaktadır. Elde edilen bulgulara göre Yakutça sözcükler diğer Türk lehçelerine oranla anlamlı derecede uzundur. Bu durum Yakutçada uzun ünlülerin harf tekrarıyla gösterilmesinden kaynaklanıyor olabilir. İncelenen lehçeler arasında tespit edilen yüksek korelasyonlar, bu lehçelerin coğrafyaya ve diller arası ses denkliklerine dayalı Kuzeydoğu dilleri sınıflandırmasına paralel bir sayısal bulgudur. Yapılan entropi analizi sonucunda en düşük entropi ve en yüksek şaşırma değerleri Yakutça metinler için elde edilmiştir. Bu bulgu, Yakutçanın sınıflandırmalarda hem Kuzeydoğu lehçelerinden biri olarak kabul edilip hem de ayrı tutulmasını destekleyen bir sonuç olarak ortaya çıkmıştır. Ayrıca Levenshtein uzaklığı açısından yapılan inceleme de bu görüşle uyuşmaktadır. Ayrıca çok boyutlu ölçekleme analiziyle ortaya çıkan şekil, diğer bulguların çoğunluğu ile aynı sonucu vermiş, Yakutçanın; Altay Türkçesi, Hakas Türkçesi ve Tuva Türkçesine kıyasla anlamlı derecede farklı olduğu tezini güçlendirmiştir.

A STATISTICAL COMPARISON OF NORTHEASTERN TURKISH DIALECTS

In the classification of Turkish languages and dialects, classifications made according to the geographical location and sound characteristics of the regions where Turks live in general come to the fore. The density of migrations in the history of Turks and the fact that they have come across different cultures make classification even more difficult. While Altai, Khakas and Tuvan Turkish are included in the classifications of the Northeastern group dialects, Yakut (Sakha) is also included in this group in some classifications (see Killi, 2002; Özyetgin, 2006 et al.), and in some classifications, it is considered as one of the distant dialects of the Turkish language together with Halac and Chuvash (see Kirişçioğlu, et al. 2018). Nevertheless, the relationship of Yakut language with this group has been underlined in many studies. This study has two purposes. First; The comparison of Altai Turkish, Khakas Turkish, Tuvan Turkish and Yakut language in terms of various criteria, and the second one is to calculate the edit distances between Altai Turkish, Khakas Turkish, Tuvan Turkish and Yakut sentences and Turkey Turkish sentences. In this context, it is aimed to provide an interdisciplinary contribution to the classification of Turkish languages. According to the findings, Yakut words are significantly longer than other Turkish dialects. This may be due to the repetition of long vowels in Yakut. The high correlations detected among the studied dialects are a numerical finding parallel to the Northeastern language classification of these dialects based on geography and interlingual sound equivalence. As a result of the entropy analysis, the lowest entropy and the highest perplexity values were obtained for the Yakut texts. This finding emerged as a result supporting both the acceptance of Yakut as one of the Northeastern dialects and keeping it separate in classifications. In addition, the examination made in terms of Levenshtein distance also agrees with this view. In addition, the figure revealed by the multidimensional scaling analysis gave the same result as the majority of the other findings, and strengthened the thesis that Yakut language was significantly different from Altai Turkish, Khakas Turkish and Tuvan Turkish.

___

  • Bentz, C., Alikaniotis, D., Cysouw, M., & Ferrer-i-Cancho, R. (2017). The entropy of words— Learnability and expressivity across more than 1000 languages. Entropy, 19(6), 275.
  • Buran, A., Alkaya, E., Özeren, M. (2019). Çağdaş Türk Yazı Dilleri 4. Kuzeydoğu Grubu. Akçağ.
  • Cox, M. A., & Cox, T. F. (2008). Multidimensional scaling. In Handbook of data visualization (pp. 315-347). Springer, Berlin, Heidelberg.
  • Elcan, A. (2016). Altay Türkçesi ile Türkiye Türkçesinin karşılaştırmalı ses ve şekil bilgisi (doktora tezi). Ardahan Üniversitesi, Sosyal Bilimler Enstitüsü.
  • Elcan, A. (2017). Altay Türkçesinin ayırt edici ses bilgisi özellikleri. Karadeniz Uluslararası Bilimsel Dergi, (35), 123-135.
  • Killi Yılmaz, G. (2011). Altay Türklerinin Dil Durumu. Modern Türklük Araştırmaları Dergisi, 8(3), 24-60.
  • Killi, G. (2002). Hakas Türkçesinin ağızları (doktora tezi), Ankara Üniversitesi, Sosyal Bilimler Enstitüsü.
  • Kirişçioğlu, F., Gökdağ, B. A., Ersoy, F. ve Doğan, T. (2018). Türk dilinin uzak lehçeleri. Akçağ.
  • Özyetgin, M. (2006). Tarihten Bugüne Türk Dili Alanı. (Conference) Chinese Academy of Social Science, Sino-Foreign Relationship Department of Institute of History, Beijing (CHINA) (23 January 2006). www.eurasianhistory.com.
  • Saraçlı, S. ve Akın, C. (2014). Intertextual comparison of Turkish dialects via entropy approximation. Electronic Turkish Studies, 9(12), 1-7.