İki Düzeyli Özbek Morfolojisi

Biçimbilimsel (morfolojik) belirsizlik giderme, sözdizimsel ayrıştırma ve makine çeviri sistemlerinin temelini oluşturan morfolojik analiz, doğal dil işlemedeki ana konulardan birisidir. İki düzeyli morfoloji, biçimbilimsel olarak karmaşık dillerin analizi ve üretimi için ilk genel model olarak bilinir. Bu makalede, Özbekçe’nin iki düzeyli morfolojik analizi, Nuve biçimbilimsel çözümleyici ile ayrıntılı olarak sunulmaktadır. Nuve, biçimbilimsel analiz için kullanılan açık kaynak kodlu bir kütüphanedir. Nuve Studio, www.nuvestudio.com internet adresinden erişilebilmekte olup, bu çalışma için geliştirilmiştir. Uygulama aşamasında, 30.000 kelime, kök kelime sözlüğü olarak kullanılmıştır. Çağdaş Özbekçe (yeni latin alfabesiyle) 26 iki düzeyli yazım (ortografik) kuralı ile tanımlanmıştır. Özbekçe kelime yapılarının biçim dizgeleri (morfotaktikleri) fiil ve isim paradigmaları için sonlu durum makineleri ile gösterilmiştir. Fonolojik ve morfolojik özel durumlar, kısıtlamalar ve istisnalar örneklerle verilmiştir. Bu çalışma, sözcüksel, morfolojik ve sözdizimsel açıdan birçok ortak yönü bulunan Özbekçe ile diğer Türk dilleri arasında, Özbekçe dil işleme ve morfoloji tabanlı makine çevirisi için öncü bir çalışma olacaktır.

Two Level Uzbek Morphology

Morphological analysing is one of the main issues in natural language processing and which is base for morphological disambiguation, syntactic parsing and machine translation systems. Two level morphology is known as the first general model for the analysis and generation of morphologically complex languages. This paper gives a detailed two level morphological analysis of Uzbek via Nuve Studio morphological analyser. Nuve is an open source library for morphological analysis. Nuve Studio is developed for this study, which is available on www.nuvestudio.com. In the implementation, 30.000 words are used as root word lexicon. The ortographic rules of contemporary Uzbek (in new Latin alphabet) are encoded using 26 two level rules. Morphotactics of Uzbek word structures have been encoded as finite state machines for verbal and nominal paradigm. Phonological and morphological special cases, limitations and exceptions are given with examples. This study will be pioneering study for Uzbek language processing and morphology based machine translation between Uzbek and other Turkic languages which have a lot in common from lexical, morphological and syntactic aspects.

___

  • Üşenmez E. Modern Özbek Türkçesinin Oluşumu. Turkish Studies (Elektronik) 2017; 12(7): 463-476.
  • Koskenniemi K. Two-level model for morphological analysis. In: IJCAL.1983; 683-685.
  • Koskenniemi K. Two-level morphology: A General Computational Model for Word-Form Recognition and Production. University of Helsinki, Dept. of General Linguistics 1983; 11.
  • Agirre E, Alegria I, Arregi X, Artola X, de Ilarraza AD et al. XUXEN: A spelling checker/corrctor for Basque based on Two-Level morphology. In: Third Conference on Applied Natural Language Processing. 1992; 119-125.
  • Hurskainen A. A Two-Level Computer Formalism fort he Analysis of Bantu Morphology An Application to Swahili.In: NJAS. 1992; 1:87-119.
  • Alam YS. A Two-Level Morphological Analysis of Japanese. In: Texas Linguistic Forum. 1983; 22:229-252.
  • Kim DB, Lee SJ, Choi KS, Kim GC. A two-level morphological analysis of Korean. In: COLING The 15th International Conference on Computational Linguistics. 1994; 1:535-539.
  • Oflazer K. Two-level description of Turkish morphology. Literary and linguistic computing 1994; 9(2): 137-148.
  • Zafer HR, Tilki B, Kurt A, Kara M. Two-level description of Kazakh morphology. In: Proceedings of the 1st International Conference on Foreign Language Teaching and Applied Linguistics (FLTAL). 2011; 560-564.
  • Yiner Z, Kurt A, Kulamshaev K, Zafer HR. Kyrgyz Orthography and Morphotactics with Implementation in NUVE. In: International Conference on Engineering and Natural Science (ICENS), Sarajevo, Bosnia-Herzegovina. 2016; 1650-1658.
  • Principal Orthographic Rules For The Uzbek Language. The Uzbekistan Cabinet of Minister’s Resolution No. 339., of August 24, 1995. Tashkent, Uzbekistan.
  • Matlatipov G, Vetulani Z. Representation of uzbek morphology in prolog. In: Aspects of Natural Language Processing. Springer, Berlin, Heidelberg, 2009; 83-110.
  • Atadjanov JA. Models of Morphological Analysis of Uzbek Words. Кибернетика и программирование 2016; 6:70-73.
  • Abdurakhmonova NZ. A Two-Level Morphological Analysis Of The Uzbek Corpus. Иностранная филология. Социальная и национальная вариативность языка и литературы 2019; 425-430.
  • Yusupova N. Türkçe Özbekçe Sözlük. Ankara, Türkiye: Türk Dil Kurumu, 2018.
  • Üşenmez E, Boltabayev S, Tuğlacı G. Özbekçe-Türkçe Sözlük. İstanbul, Türkiye: Türk Dünyası Vakfı, 2016.
  • Van Der Hulst H, Van De Weıjer J. Topics in Turkish phonology. Turkish Linguistics Today. 1991; 11-59.
  • Üşenmez E. Modern Özbek Türkçesi: (Giriş-Özbekistan-Dil Tarihi-Metinler-Gramer-Sözlük). İstanbul, Türkiye Akademik Kitaplar, 2012.
  • Nuve Studio (2021). Nuve Studio [online] http://nuvestudio.com [accessed 11. Month Year].
  • Küçük AE. Nuve Studio Source Code. https://github.com/kucukea/nuve-studio, 2021.
  • Zafer HR. Nuve : A Natural Language Processing Library for Turkish in C#. https://github.com/hrzafer/nuve, 2021.
Fırat Üniversitesi Mühendislik Bilimleri Dergisi-Cover
  • ISSN: 1308-9072
  • Yayın Aralığı: Yılda 2 Sayı
  • Başlangıç: 1987
  • Yayıncı: FIRAT ÜNİVERSİTESİ