HALAÇ TÜRKÇESİNİN AĞIZLARI İLE GÜNEY AZERBAYCAN TÜRKÇESİNİN KUM (COUZEH) AĞZI ARASINDAKİ SÖZLÜKSEL UZAKLIK: LEVENSHTEIN VE DIJKSTRA ALGORİTMALARI AMALGAMI
Bu çalışma, İran’ın Merkezī ve Kum vilayetlerinde konuşulmakta
olan iki Türk dili değişkesinin Halaç Türkçesi ve Güney Azerbaycan Türkçesi-
sözlüksel uzaklığını Leipzig-Jakarta çekirdek sözcük listesindeki
maddeler temelinde saptamayı amaçlamaktadır. Bu bağlamda Halaç Türkçesinin
Merkezī ve Kum vilayetlerinde konuşulan, Doerfer’in tasnif etmiş
olduğu tüm ağız bölgeleri ile Güney Azerbaycan Türkçesinin Kum’da konuşulduğu
tanıklanmış olan Couzeh değişkesi, çalışmada karşılaştırmalı
olarak incelenecektir. Yöntem olarak nicel lehçe/ağız ölçüm yöntemleri
arasında ilgili uluslararası alan yazında sıklıkla yararlanılan Levenshtein
uzaklık algoritması (LUA) söz konusu değişkeler arasındaki uzaklığı
saptamak amacıyla kullanılacak, sonrasında ortaya çıkan değerler ışığında
Güney Azerbaycan Türkçesinin (GAT) Couzeh değişkesi ile Halaç türkçesi
ağızları arasında Dijkstra algoritması ile minimum yol sorgulanacaktır.
Dijkstra algoritmasının uygulanmasında ağızlar birer köşe ve ağızlar arası
LUA ile ölçülen değerler köşeler arası kenar değerleri olarak alınacaktır.
Çalışmada ayrıca eskicil özellikleri ile tanınan ve Türk dilinin sui generis
bir dalını teşkil ettiği belirtilen Halaç Türkçesi (Tekin, 1989) ile bir Oğuz değişkesi olan GAT arasında coğrafi yakınlığın sözlüksel etkisinin olup
olmadığı da (alansal yakınsama) incelenmiştir. Çalışmada kullanılan veriler
2021 yılında Temmuz ve Eylül ayları arasında gerçekleştirilmiş olan
alan araştırması sırasında İran’da Merkezī ve Kum vilayetlerinin Halaç
Türkçesikonuşulan tüm yerleşim birimlerinden ve Kum vilayetinde Azerbaycan
Türkçesi konuşulan ancak Halaç Türkçesi yerleşimlerle çevrili
Couzeh köyünden derlenmiştir. Bu çalışma kapsamında aynı dil ekolojisi
içerisinde konuşulmakta olan iki Türk dili değişkesinin sözlüksel uzaklığı
algoritmik çerçevede ölçülerek sözcüklerin ses bilgisel uzaklıklarının söz
konusu dil ekolojisi dâhilindeki oranları saptanmıştır. Elde edilmiş olan
bulgular, Halaç Türkçesi ile GAT arasındaki sözlüksel uzaklığın paylaşılan
ortak dil ekolojisine rağmen göreceli olarak anlamlı olduğuna işaret
etmektedir.
Lexical Distance between the Khalaj Dialects and the Qom (Couzeh) Dialect of South Azerbaijani Turkic: An Amalgam of Levenshtein and Dijkstra Algorithms
This study explores the lexical distance of two Turkic language
varieties, namely Khalaj and South Azerbaijani Turkic, spoken in
the Markazī and Qom provinces, based on the Leipzig-Jakarta core
vocabulary list (Tadmor and Haspelmath, 2009). To this end, all Khalaj
dialects spoken in Markazī and Qom provinces, as classified by Doerfer
(1998), and the Couzeh variety of South Azerbaijani were compared in the
present study. Levenshtein Distance Algorithm (LDA), frequently utilized
in the relevant literature among quantitative dialectal measurement
as a quantitative method, was used to determine the distance between
the mentioned varieties. Using the emergent values, the minimum path
between the Couzeh variety and Khalaj dialects was measured, using
the Dijkstra Algorithm. The study also investigates whether there is any
impact of geographical proximity (areal convergence) between Khalaj
(Doerfer, 1971, 1987, 1988; Tekin, 1989) and South Azerbaijani. The
data used in the study during the fieldwork carried out between July and
September, 2021 were compiled from all Khalaj-speaking settlements
in Markazī and Qom provinces in Iran, and from the village of Couzeh,
where South Azerbaijani is spoken in the province of Qom. Within the
scope of this study, the lexical distance of two Turkic varieties spoken in
the same language habitat was measured in an algorithmic framework,
and the ratios of the phonological distances of the lexical items were
measured. The findings revealed that the lexical distance between Khalaj
and Southern Azerbaijani is relatively significant despite the shared
common language ecology.
___
- Anonby, E. (2012). Lori language ii. Sociolinguistic Status of Lori. Encyclopædia
Iranica. https://iranicaonline.org/articles/lori-language-ii
- Bolognesi, R. ve Heeringa, W. (2002). De invloed van dominante talen op het
lexicon en de fonologie van Sardische dialecten. Gramma/TTT, 1: tijdschrift
voor taalwetenschap, 9(1), 45-84.
- Çam, A. (2021). Şahseven Türkçesi [Yayımlanmamış doktora tezi]. İstanbul
Kültür Üniversitesi.
- Dijkstra, E. W. (1959). A note on two problems in connexion with graphs.
Numerische Mathematik, 1, 269-271.
- Doerfer, G. Hesche, W., Scheinhardt, H. ve Tezcan, S. (1971). Khalaj materials.
Indiana University Press.
- Doerfer, G. (1987). Lexik und Sprachgeographie des Chaladsch. 2 Volumes.
Harrassowitz.
- Doerfer, G. (1988). Grammatik des Chaladsch (Turcologica 4). Harrassowitz.
- Doerfer, G. (1998). Turkic languages of Iran. L. Johanson & É. Á. Csató (Eds.)
içinde, The Turkic Languages (s. 273-282). Rotledge.
- Dreyfus, S. E. (1969). An appraisel of some shortest-path algorithms. Operations
research, 17, 395-412.
- Eberhard, D. M., Gary F. S. & Charles D. F. (Eds.). (2022). Ethnologue: Languages
of the world. Twenty-fifth edition. SIL International. Online version: http://
www.ethnologue.com.
- Goebl, H. (1982). Dialektometrie; Prinzipien und Methoden des Einsatzes der
Numerischen Taxonomie im Bereich der Dialektgeographie. Akademie der
Wissenschaften.
- Goebl, H. (2017). Dialectometry. Ch. Boberg, J. A. Nerbonne & D. Watt (Eds.),
The Handbook of Dialectology içinde (s. 123-142). Wiley-Blackwell.
- Gooskens, C. & Heeringa, W. (2004). Perceptive evaluation of Levenshtein dialect
distance measurements using Norwegian dialect data. Language Variation
and Change, 16(3), 189-207.
- Gudschinsky, S. C. (1956). The ABC’s of lexicostatistics (glottochronology).
Word, 12(2), 175-210.
- Haspelmath, M. & Tadmor, U. (Eds.). (2009). Loanwords in the World’s
Languages: A Comparative Handbook. Walter de Gruyter. https://doi.
org/10.1515/9783110218442.55
- Heeringa, W. J. (2004). Measuring dialect pronunciation differences using
Levenshtein distance. Unpublished Doctoral Dissertation. University Library
Groningen.
- Heeringa, W. & Prokić, J. (2017). Computational dialectology. C. Boberg, J. A.
Nerbonne, & D. Watt (Eds.), The Handbook of Dialectology içinde (s. 330-
347). Wiley-Blackwell.
- Kuribayashi, Y. (2012). Grammaticalized topics in Kashkay: The implication for
the relativization of Turkic languages. Studia Uralo-Altaica, 49, 311-318.
- Minorsky, M. (1940). The Turkish Dialect of the Khalaj, Bulletin of the Society of
Oriental and African Studies 10, 417-37.
- Moġäddäm, M. (1318). Guyešha̬-ye Wäfs wä Täfräš, Ira̬n-Kudé 11 (Teheran, h.š.).
- Nerbonne, J. & Heeringa, W. (2010). Measuring dialect differences. P. Auer & J. E.
Schmidt (Eds), An International Handbook of Linguistic Variation. Theories
and Methods Volume 1 içinde (s. 550-566). De Gruyter Mouton. https://doi.
org/10.1515/9783110220278
- Nerbonne, J. & Siedle, C. (2005). Dialektklassifikation auf der Grundlage aggregierter
Ausspracheunterschiede. Zeitschrift für Dialektologie und Linguistik,
129-147.
- Osenova, P., Heeringa, W. & Nerbonne, J. (2009). A quantitative analysis of
Bulgarian dialect pronunciation. Zeitschrift für slavische Philologie, 66(2),
425-458.
- Séguy, J. (1973). La dialectométrie dans l’Atlas linguistique de la Gascogne.
Revue de linguistique romane, 37, 1-24.
- Ruohonen, K. (2008). Graph theory. Tampere University of Technology.
- Szmrecsanyi, B. (2013). Grammatical variation in British English dialects: A
study in corpus-based dialectometry. Series: Studies in English Language.
Cambridge University Press.
- Tadmor, U. (2009). Loanwords in the world’s languages: Findings and results.
M. Haspelmath & U. Tadmor (Eds.), Loanwords in the World’s Languages:
A Comparative Handbook içinde (s. 55-75). Walter de Gruyter. https://doi.
org/10.1515/9783110218442.55.
- Tekin, T. (1989). Türk dili diyalektlerinin yeni bir tasnifi. Erdem, 5(13), 141-168.
Whiting, P. D. & Hillier, J. A. (1960). A method for finding the shortest route through
a road network, Operations Research Quarterly, 11, 37-40.
- Wieling, M., Prokić, J. & Nerbonne, J. (2009). Evaluating the pairwise string
alignment of pronunciations. Proceedings of the EACL 2009 Workshop on
Language Technology and Resources for Cultural Heritage, Social Sciences,
Humanities, and Education (LaTeCH–SHELT&R 2009) içinde (s. 26-34).
- Windfuhr, G. (Ed.). (2009). The Iranian languages. Routledge.
- Windfuhr, G. & Perry, J. R. (2009). Persian and Tajik. G. Windfuhr (Ed.) içinde,
The Iranian Languages (s. 416-545). Routledge.