HALAÇ TÜRKÇESİNİN AĞIZLARI İLE GÜNEY AZERBAYCAN TÜRKÇESİNİN KUM (COUZEH) AĞZI ARASINDAKİ SÖZLÜKSEL UZAKLIK: LEVENSHTEIN VE DIJKSTRA ALGORİTMALARI AMALGAMI

Bu çalışma, İran’ın Merkezī ve Kum vilayetlerinde konuşulmakta olan iki Türk dili değişkesinin Halaç Türkçesi ve Güney Azerbaycan Türkçesi- sözlüksel uzaklığını Leipzig-Jakarta çekirdek sözcük listesindeki maddeler temelinde saptamayı amaçlamaktadır. Bu bağlamda Halaç Türkçesinin Merkezī ve Kum vilayetlerinde konuşulan, Doerfer’in tasnif etmiş olduğu tüm ağız bölgeleri ile Güney Azerbaycan Türkçesinin Kum’da konuşulduğu tanıklanmış olan Couzeh değişkesi, çalışmada karşılaştırmalı olarak incelenecektir. Yöntem olarak nicel lehçe/ağız ölçüm yöntemleri arasında ilgili uluslararası alan yazında sıklıkla yararlanılan Levenshtein uzaklık algoritması (LUA) söz konusu değişkeler arasındaki uzaklığı saptamak amacıyla kullanılacak, sonrasında ortaya çıkan değerler ışığında Güney Azerbaycan Türkçesinin (GAT) Couzeh değişkesi ile Halaç türkçesi ağızları arasında Dijkstra algoritması ile minimum yol sorgulanacaktır. Dijkstra algoritmasının uygulanmasında ağızlar birer köşe ve ağızlar arası LUA ile ölçülen değerler köşeler arası kenar değerleri olarak alınacaktır. Çalışmada ayrıca eskicil özellikleri ile tanınan ve Türk dilinin sui generis bir dalını teşkil ettiği belirtilen Halaç Türkçesi (Tekin, 1989) ile bir Oğuz değişkesi olan GAT arasında coğrafi yakınlığın sözlüksel etkisinin olup olmadığı da (alansal yakınsama) incelenmiştir. Çalışmada kullanılan veriler 2021 yılında Temmuz ve Eylül ayları arasında gerçekleştirilmiş olan alan araştırması sırasında İran’da Merkezī ve Kum vilayetlerinin Halaç Türkçesikonuşulan tüm yerleşim birimlerinden ve Kum vilayetinde Azerbaycan Türkçesi konuşulan ancak Halaç Türkçesi yerleşimlerle çevrili Couzeh köyünden derlenmiştir. Bu çalışma kapsamında aynı dil ekolojisi içerisinde konuşulmakta olan iki Türk dili değişkesinin sözlüksel uzaklığı algoritmik çerçevede ölçülerek sözcüklerin ses bilgisel uzaklıklarının söz konusu dil ekolojisi dâhilindeki oranları saptanmıştır. Elde edilmiş olan bulgular, Halaç Türkçesi ile GAT arasındaki sözlüksel uzaklığın paylaşılan ortak dil ekolojisine rağmen göreceli olarak anlamlı olduğuna işaret etmektedir.

Lexical Distance between the Khalaj Dialects and the Qom (Couzeh) Dialect of South Azerbaijani Turkic: An Amalgam of Levenshtein and Dijkstra Algorithms

This study explores the lexical distance of two Turkic language varieties, namely Khalaj and South Azerbaijani Turkic, spoken in the Markazī and Qom provinces, based on the Leipzig-Jakarta core vocabulary list (Tadmor and Haspelmath, 2009). To this end, all Khalaj dialects spoken in Markazī and Qom provinces, as classified by Doerfer (1998), and the Couzeh variety of South Azerbaijani were compared in the present study. Levenshtein Distance Algorithm (LDA), frequently utilized in the relevant literature among quantitative dialectal measurement as a quantitative method, was used to determine the distance between the mentioned varieties. Using the emergent values, the minimum path between the Couzeh variety and Khalaj dialects was measured, using the Dijkstra Algorithm. The study also investigates whether there is any impact of geographical proximity (areal convergence) between Khalaj (Doerfer, 1971, 1987, 1988; Tekin, 1989) and South Azerbaijani. The data used in the study during the fieldwork carried out between July and September, 2021 were compiled from all Khalaj-speaking settlements in Markazī and Qom provinces in Iran, and from the village of Couzeh, where South Azerbaijani is spoken in the province of Qom. Within the scope of this study, the lexical distance of two Turkic varieties spoken in the same language habitat was measured in an algorithmic framework, and the ratios of the phonological distances of the lexical items were measured. The findings revealed that the lexical distance between Khalaj and Southern Azerbaijani is relatively significant despite the shared common language ecology.

___

  • Anonby, E. (2012). Lori language ii. Sociolinguistic Status of Lori. Encyclopædia Iranica. https://iranicaonline.org/articles/lori-language-ii
  • Bolognesi, R. ve Heeringa, W. (2002). De invloed van dominante talen op het lexicon en de fonologie van Sardische dialecten. Gramma/TTT, 1: tijdschrift voor taalwetenschap, 9(1), 45-84.
  • Çam, A. (2021). Şahseven Türkçesi [Yayımlanmamış doktora tezi]. İstanbul Kültür Üniversitesi.
  • Dijkstra, E. W. (1959). A note on two problems in connexion with graphs. Numerische Mathematik, 1, 269-271.
  • Doerfer, G. Hesche, W., Scheinhardt, H. ve Tezcan, S. (1971). Khalaj materials. Indiana University Press.
  • Doerfer, G. (1987). Lexik und Sprachgeographie des Chaladsch. 2 Volumes. Harrassowitz.
  • Doerfer, G. (1988). Grammatik des Chaladsch (Turcologica 4). Harrassowitz.
  • Doerfer, G. (1998). Turkic languages of Iran. L. Johanson & É. Á. Csató (Eds.) içinde, The Turkic Languages (s. 273-282). Rotledge.
  • Dreyfus, S. E. (1969). An appraisel of some shortest-path algorithms. Operations research, 17, 395-412.
  • Eberhard, D. M., Gary F. S. & Charles D. F. (Eds.). (2022). Ethnologue: Languages of the world. Twenty-fifth edition. SIL International. Online version: http:// www.ethnologue.com.
  • Goebl, H. (1982). Dialektometrie; Prinzipien und Methoden des Einsatzes der Numerischen Taxonomie im Bereich der Dialektgeographie. Akademie der Wissenschaften.
  • Goebl, H. (2017). Dialectometry. Ch. Boberg, J. A. Nerbonne & D. Watt (Eds.), The Handbook of Dialectology içinde (s. 123-142). Wiley-Blackwell.
  • Gooskens, C. & Heeringa, W. (2004). Perceptive evaluation of Levenshtein dialect distance measurements using Norwegian dialect data. Language Variation and Change, 16(3), 189-207.
  • Gudschinsky, S. C. (1956). The ABC’s of lexicostatistics (glottochronology). Word, 12(2), 175-210.
  • Haspelmath, M. & Tadmor, U. (Eds.). (2009). Loanwords in the World’s Languages: A Comparative Handbook. Walter de Gruyter. https://doi. org/10.1515/9783110218442.55
  • Heeringa, W. J. (2004). Measuring dialect pronunciation differences using Levenshtein distance. Unpublished Doctoral Dissertation. University Library Groningen.
  • Heeringa, W. & Prokić, J. (2017). Computational dialectology. C. Boberg, J. A. Nerbonne, & D. Watt (Eds.), The Handbook of Dialectology içinde (s. 330- 347). Wiley-Blackwell.
  • Kuribayashi, Y. (2012). Grammaticalized topics in Kashkay: The implication for the relativization of Turkic languages. Studia Uralo-Altaica, 49, 311-318.
  • Minorsky, M. (1940). The Turkish Dialect of the Khalaj, Bulletin of the Society of Oriental and African Studies 10, 417-37.
  • Moġäddäm, M. (1318). Guyešha̬-ye Wäfs wä Täfräš, Ira̬n-Kudé 11 (Teheran, h.š.).
  • Nerbonne, J. & Heeringa, W. (2010). Measuring dialect differences. P. Auer & J. E. Schmidt (Eds), An International Handbook of Linguistic Variation. Theories and Methods Volume 1 içinde (s. 550-566). De Gruyter Mouton. https://doi. org/10.1515/9783110220278
  • Nerbonne, J. & Siedle, C. (2005). Dialektklassifikation auf der Grundlage aggregierter Ausspracheunterschiede. Zeitschrift für Dialektologie und Linguistik, 129-147.
  • Osenova, P., Heeringa, W. & Nerbonne, J. (2009). A quantitative analysis of Bulgarian dialect pronunciation. Zeitschrift für slavische Philologie, 66(2), 425-458.
  • Séguy, J. (1973). La dialectométrie dans l’Atlas linguistique de la Gascogne. Revue de linguistique romane, 37, 1-24.
  • Ruohonen, K. (2008). Graph theory. Tampere University of Technology.
  • Szmrecsanyi, B. (2013). Grammatical variation in British English dialects: A study in corpus-based dialectometry. Series: Studies in English Language. Cambridge University Press.
  • Tadmor, U. (2009). Loanwords in the world’s languages: Findings and results. M. Haspelmath & U. Tadmor (Eds.), Loanwords in the World’s Languages: A Comparative Handbook içinde (s. 55-75). Walter de Gruyter. https://doi. org/10.1515/9783110218442.55.
  • Tekin, T. (1989). Türk dili diyalektlerinin yeni bir tasnifi. Erdem, 5(13), 141-168. Whiting, P. D. & Hillier, J. A. (1960). A method for finding the shortest route through a road network, Operations Research Quarterly, 11, 37-40.
  • Wieling, M., Prokić, J. & Nerbonne, J. (2009). Evaluating the pairwise string alignment of pronunciations. Proceedings of the EACL 2009 Workshop on Language Technology and Resources for Cultural Heritage, Social Sciences, Humanities, and Education (LaTeCH–SHELT&R 2009) içinde (s. 26-34).
  • Windfuhr, G. (Ed.). (2009). The Iranian languages. Routledge.
  • Windfuhr, G. & Perry, J. R. (2009). Persian and Tajik. G. Windfuhr (Ed.) içinde, The Iranian Languages (s. 416-545). Routledge.