Türkçe Öğrenen Derlemi için Hata Etiketleme Sistemi

Öğrenen derlemleri, bir dili yabancı veya ikinci dil olarak öğrenenlerin ortaya koyduğu metinlerin elektronik koleksiyonlarıdır. İkinci dil edinimi ve yabancı dil öğrenimi alanlarında yaygın olarak kullanılan öğrenen derlemleri, öğrenen dilini araştırmaya olanak sağlayan güvenilir araçlar olarak karşımıza çıkmaktadır. Bu çalışmanın amacı, 94 ülkeden gelen öğrencilere ait sınav kağıtlarından oluşan 274 bin kelimelik Türkçe Öğrenen Derleminin temelinde Türkçeye özgü bir hata etiketleme sistemini geliştirmektir. Derlemdeki metinler, orijinallerine sadık kalınarak manuel olarak bilgisayar ortamına aktarıldıktan sonra 44 bin kelimelik çekirdek derlem oluşturulmuş ve üzerinde hata etiketlemesi yapılmıştır. Hata etiketleme sistemi, ilk harfin hata alanını temsil ettiği, sonraki harflerin ise hata kategorisini ve geçerli ise kelime türünü belirttiği üç veya dört harfli kodlara dayanmaktadır. Toplamda 58 hata kodu mevcuttur. Tasarlanan hata etiketleme sistemi, Türkçe öğrenenlerin dil yeterliliğini değerlendirmek ve hata etiketlemesi içeren diğer Türkçe öğrenen derlemlerini oluşturmak için kullanılabilecektir.

An Error Coding System for the Turkish Learner Corpus

Learner corpora are electronic collections of texts produced by learners of a foreign or second language. Learner corpora are reliable tools for investigating learner language and are widely used in the fields of second language acquisition and foreign language learning. This paper describes an error tagging system that has been designed on the basis of the 274,000-word Turkish learner corpus that comprises the Turkish examination papers written by learners coming from 94 different countries. The texts were manually keyboarded while retaining all errors, after which a 44,000-word component of the corpus was error coded using the specially devised error tag set. The majority of codes are based on a three- or four-letter system in which the first letter represents the error domain and the next series of letters identify the error category, as well as the word class where relevant. The error tag set has a total of 58 possible codes. The designed error tagging system can be used to assess the linguistic competence of Turkish learners and to build other error-annotated Turkish learner corpora. 

___

  • Ak Başoğul D. & Can, F.S. (2014). Yabancı dil olarak Türkçe öğrenen Balkanlı öğrencilerin yazılı anlatımda yaptıkları hatalar üzerine tespitler. Dil ve Edebiyat Eğitimi Dergisi, 10, 100-119. google scholar
  • Albayrak, F. (2010). Türkçe öğrenen Moğol öğrencilerin yazılı anlatım yanlışlarının dil bilgisi açısından değerlendirilmesi. (Yüksek Lisans Tezi). Atatürk Üniversitesi Sosyal Bilimler Enstitüsü, Erzurum. google scholar
  • Aytan, T. & Güney, N. (2015). Türkçeyi yabancı dil olarak öğrenen öğrencilerin yazılı anlatımlarında karşılaşılan sorunlar (Yıldız Tömer örneklemi). International Journal of Languages’ Education and Teaching, 3(2), 275- 288. google scholar
  • Büyükikiz, K.K. & Hasırcı, S. (2013). Yabancı dil olarak Türkçe öğrenen öğrencilerin yazılı anlatımlarının yanlış çözümleme yaklaşımına göre değerlendirilmesi. Ana Dili Eğitimi Dergisi, 1(4), 51-62. google scholar
  • Çerçi, A., Derman, S. & Bardakçı, M. (2016). Yabancı dil olarak Türkçe öğrenen öğrencilerin yazılı anlatımlarına yönelik yanlış çözümlemesi. Gaziantep University Journal of Social Sciences, 15(2), 695-715. google scholar
  • Çetinkaya, G. (2015). Yanlış çözümlemesi: yabancı dil olarak Türkçe öğrenen B2 düzeyindeki öğrencilerin yazılı metinlerine ilişkin görünümler. International Journal of Language’s Education and Teaching, 3(1), 164-178. google scholar
  • Dagneaux, E., Denness, S., Granger, S., Meunier, F., Neff, J., & Thewissen J. (Eds.) (2005). UCL error-tagging manual, Version 1.2. Louvain-la-Neuve: Centre for English Corpus Linguistics, Université Catholique de
  • Louvain.Díaz-Negrillo, A. & Fernández-Domínguez, J. (2006). Error tagging systems for learner corpora. Revista española de lingüística aplicada, 19, 83-102. Erişim adresi: https://www.researchgate. net/publication/28137922_Error_Tagging_Systems_for_Learner_Corpora google scholar
  • Díez Bedmar, M. B. (2011). Detecting learning disorders in students’ written production in the foreign language: Are learner corpora of any help? Porta Linguarum, 15, 35-54. google scholar
  • Emiroğlu, S. (2014). Türkçe öğrenen yabancı öğrencilerin yazılı anlatımlarında Türkçenin dil bilgisi ve yazım özellikleriyle ilgili karşılaştığı zorluklar. International Journal of Language Academy, 2(3), 99-119.
  • Ersoy, Ş. (1997). Türkçe öğrenen yabancıların yazılı anlatım yanlışlarının dil bilgisi açısından değerlendirilmesi. (Yüksek Lisans Tezi). Ankara Üniversitesi Sosyal Bilimler Enstitüsü, Ankara. google scholar
  • Granger S. (2008). Learner corpora. In Lüdeling, A. & Kytö, M. (Eds.) Corpus Linguistics. An International Handbook (pp. 259-275). Berlin & New York: Walter de Gruyter. Erişim adresi: https://www.researchgate. net/publication/273480731_Learner_Corpora google scholar
  • Granger, S. (2013). Error-tagged Learner Corpora and CALL: A Promising Synergy. CALICO Journal, 20(3), 465-480. https://doi.org/10.1558/cj.v20i3.465-480 google scholar
  • Hana, J., Rosen, A., Skodová, S., & Stindlová, B. (2010). Error-Tagged Learner Corpus of Czech. Proceedings of the Fourth Linguistic Annotation Workshop, 11-19. Erişim adresi: https://aclanthology.org/W10-1802.pdf google scholar
  • Hunston, S. (2002). Corpora in Applied Linguistics. Cambridge: Cambridge University Press. google scholar
  • Islıoğlu, S. (2014). Yabancı dil olarak Türkçenin öğretiminde nesne durum ekinin kullanımı ile ilgili yanlışlar ve çözüm önerileri. Route Educational and Social Science Journal, 1(2), 101-115. google scholar
  • İnan, K. (2014). Yabancı dil olarak Türkçe öğrenen İranlıların yazılı anlatımlarının hata analizi bağlamında değerlendirilmesi. International Periodical for the Languages, Literature and History of Turkish or Turkic, 9(9), 619-649. google scholar
  • Izumi, E., Uchimoto, K., & Isahara, H. (2005). Error Annotation for Corpus of Japanese Learner English. Proceedings of the Sixth International Workshop on Linguistically Interpreted Corpora (LINC-2005), 71-80. Erişim adresi: https://aclanthology.org/I05-6009.pdf google scholar
  • Kıvrak, D. (2019). Türkçeyi ikinci dil olarak öğrenen öğrencilerin Türkçe yeterlik algı düzeyleri ve Türkçe yazılı anlatımlarındaki yazım yanlışları. (Yüksek Lisans Tezi). Muğla Sıtkı Koçman Üniversitesi Eğitim Bilimleri Enstitüsü, Muğla. google scholar
  • López, W.C. (2009). Error analysis in a learner corpus: what are the learners’ strategies? Erişim adresi: https:// www.um.es/lacell/aelinco/contenido/pdf/45.pdf google scholar
  • Meyer, Charles F. (2002). English Corpus Linguistics. Cambridge: Cambridge University Press. google scholar
  • Nicholls, D. (2003). The Cambridge Learner Corpus error coding and analysis for lexicography and ELT. Proceedings of the Corpus Linguistics 2003 Conference, 16, 572-581. Erişim adresi: http://ucrel.lancs. ac.uk/publications/cl2003/papers/nicholls.pdf google scholar
  • Sarıca, N. ve Od, Ç. (2015). Yabancı dil olarak Türkçe öğretiminde tamlama algısı sorunları. International Journal of Language Academy, 3(1), 389-398. google scholar
  • Subaşı Adalar, D. (2010). Tömer’de yabancı dil olarak Türkçe öğrenen Arap öğrencilerin kompozisyonlarında hata analizi. Dil Dergisi, 148, 6-16. google scholar
  • Şahin, E. Y. (2013). Yabancı dil olarak Türkçe öğrenen öğrencilerin yazılı anlatımlarındaki ek yanlışları. Tarih Okulu Dergisi, 6 (15), 433-449. google scholar
  • Yılmaz, F. ve Bircan, D. (2015). Türkçe öğretim merkezinde okuyan yabancı öğrencilerin yazılı kompozisyonlarının yanlış çözümleme yöntemine göre değerlendirilmesi. International Journal of Language Academy, 3(1), 113-126. google scholar