Derlem Dilbilim ve Derleme Kuramsal Bir Bakış

Dil ve dile yönelik çalışmalar yüzyıllardan beri devam etmekte olup her araştırmacı tarihsel süreçteki bilgi birikimi ile yeni çıkarımlarda bulunmaktadır. Teknoloji ve bilişimdeki gelişim bilgiyi ve bilgiyle ilişkili olan her şeyi etkilemektedir. Dil ve dil pratiklerini inceleme, betimleme, analiz etmede kullanılan derlem dilbilim alanı da bu gelişimden etkilenmiş; 1970’lere kadar kurumsal yapıların bünyesinde yapılan derlem araştırmaları takip eden yıllarda geliştirilen araçlarla, yazılımlarla bağımsız araştırmacılar tarafından da yürütülmeye başlanmıştır. Süreçte derlemlerin veri setleri de dönüşerek milyon kelimelik yapılara bürünmüştür. Tüm bu gelişmeler derlem ve derlem dilbilimin temel ilkelerini ve araştırma alanlarını belirginleştirmiştir. Bağımsız araştırmacılar tarafından da yürütülmeye başlanan derlem çalışmaları ile derlem tasarımına yönelik temsil edicilik, denge, örnekçe, boyut, makine tarafından okunabilirlik, telif hakları gibi ilkelerin öne çıktığı saptanmıştır. Derlemler oluşturma amaçlarına göre genel, özel, tarihsel, etiketlenmiş, etiketlenmemiş, öğrenci derlemleri gibi türlere de ayrılmıştır. Bu araştırmada da Türkiye’de son yıllarda yapılan dil ve dil eğitimi ile alakalı derlem çalışmaları üzerinde durulmuş; proje tabanlı yapılan çalışmaların alana katkıları burgulanmıştır. Derlemler kapsamında dil eğitimi alanların ve araştırmacıların kullandığı öğrenme yöntemleri değerlendirilmiş; bu yöntemlerin sürece kakıları, özerk öğrenme ya da öğrenmeyi öğrenme yaklaşımına etkileri; kelime öğretimi, deyim öğretimi; dil eğitiminde tüme varım ilkesinini işletilmesi gibi alt başlıklar değerlendirilmiştir. Bu çerçevede derlem ve derlem dilbilime yönelik araştırmacılarda kuramsal bir alt yapının oluşumu hedeflenmiştir.

Corpus Linguistics and Corpus A Theoretical Perspective

Language and language studies have been going on for centuries; each researcher makes new inferences with his knowledge in the historical process. The development of technology and informatics has affected knowledge and everything related to knowledge. Corpus linguistics, which is used to examine, describe and analyze language and language practices, was also affected by this development; Corpus research carried out within institutional structures until the 1970s, with tools and software developed in the following years, decreased to the level of independent researchers. In the process, the data sets of the corpus also transformed into structures of million words. All these developments have clarified the basic principles and research areas of corpus and corpus linguistics. With the corpus studies, which were also started to be carried out by independent researchers, principles such as representativeness, balance, sample, size, machine readability, copyrights were determined for corpus design. In the following process, corpus was also divided into types such as general, special, marked, historical, marked, unmarked, student corpus. Language and language education corpus studies conducted in Turkey in recent years have been emphasized; The contributions of the project-based studies to the field have been highlighted. Within the scope of the corpus, the learning methods used by language learners and researchers were emphasized; the contribution of these methods to the process, their contribution to the concepts of autonomous learning or learning to learn; vocabulary teaching, idiom teaching; Sub-headings such as operating the principle of induction in language education were evaluated. In this framework, it is aimed to form a theoretical background in corpus and corpus linguistics researchers.

___

  • Aksan, Y., Aksan, M., Özel, S. A., Yılmazer, H., Demirhan, U. U., Mersinli, Ü. & Altunay, S. (2016). Web tabanlı Türkçe ulusal derlemi (TUD). In Proceedings of the 16th academic computing conference, 723-730.
  • Baker, P. (2010). Sociolinguistics and corpus linguistics. Edinburgh University Press.
  • Biber, D. (1990). Methodological issues regarding corpus-based analyses of linguistic variation. Literary and linguistic computing, 5(4), 257-269.
  • Conrad, S. (2002) Corpus linguistic approaches for discourse analysis, Annual Review of Applied Linguistics 22(1). 75–95.
  • Çalışkan, N. (2016). Öğrenir derlemleri: kapsam, tasarım ve uygulamalar. Turkophone, 1(1), 40-53.
  • Çalışkan, N. (2019). Diye sözcüğü üzerine derlem temelli bir betimleme. Türkbilig, (38), 163-176.
  • Chambers, A. (2010) ‘What is data-driven learning?’, in A. O’Keeffe and M. McCarthy (eds), The Routledge Handbook of Corpus Linguistics, Routledge, 345–358.
  • Claridge, C. (2008) ‘Historical corpora’, in A. Lüdeling and M. Kytö (eds), Corpus Linguistics: An International Handbook 1, Walter de Gruyter, 242–259.
  • Clear, J. (1992) ‘Corpus sampling’, in G. Leitner (ed.) New Directions in English Language Corpora. Mouton de Gruyter, 21–31.
  • Gatto, M. (2014). Web as corpus: theory and practice. A&C Black.
  • Gries, S. T. (2009). What is corpus linguistics?. Language and linguistics compass, 3(5), 1225-1241.
  • Greaves, C. & Warren, M. (2007) ‘Concgramming: A computer-driven approach to learning the phraseology of English’, ReCALL Journal, 17(3), 287–306.
  • Gündoğdu, A. E. (2012). Türk çocuk yazınında söz varlığı-derlem tabanlı bir uygulama. [Yayımlanmamış yüksek lisans tezi]. Mersin Üniversitesi Eğitim Bilimleri Enstitüsü.
  • Francis, W. & Kucˇera, H. (1964) Manual of ınformation to accompany a standard corpus of presentday edited American English, for Use with Digital Computers. Brown University, Department of Linguistics.
  • Johns, T. (1989) ‘Whence and whither classroom concordancing?’, in T. Bongaerts, P. de Haan, S. Lobbe and H. Wekker (eds), Computer Applications in Language Learning, Foris: 9–30.
  • Johns, T. (1991) ‘Should you be persuaded: two samples of data-driven learning materials’, in T. Johns and P. King (eds), Classroom Concordancing (English Language Research Journal 4), ELR: 1–10.
  • İnce, B. & Çınar, İ. (2015). Türkçe ve Türk kültürü ders kı̇taplarındakı̇ söz varlığına derlem temellı̇ bı̇r bakış. IJLET, 3(1), 198-209.
  • Karadağ, Ö. (2020). Türkçe eğitimi açısından ses-harf sıklığı üzerine bir değerlendirme. Ana Dili Eğitimi Dergisi, 8(1), 1-13.
  • Kennedy, G. (1998). An introduction to corpus linguistics. Longman.
  • Kenning, M.M. (2010) ‘What are parallel and comparable corpora and how can we use them?’, in A. O’Keeffe and M. McCarthy (eds), The Routledge Handbook of Corpus Linguistics, Routledge: 487–500.
  • Krishnamurthy, R. (2004) English Collocation Studies. Continuum (new edition of J. Sinclair, S.
  • Jones and R. Daley (1970) English Lexical Studies).
  • Kurtoğlu, Ö. A. (2015). Türkçede ad-eylem eşdizimliği için istatistiksel ve anlamsal ölçütler temelinde derlem-çıkışlı bir ulamlama. [Yayımlanmamış doktora tezi]. Ankara Üniversitesi, Sosyal Bilimler Enstitüsü.
  • Kübler, N. & Aston, G. (2010). Using corpora in translation. The Routledge handbook of corpus linguistics, 505-515.
  • Leech, G. (1991) ‘The State-of-the-Art in corpus linguistics’, in K. Aijmer and B. Altenberg (eds) English Corpus Linguistics, Studies in Honour of Jan Svartvik. Longman, 8–29.
  • Lee, D.Y.W. (2010) ‘What corpora are available?’, in A. O’Keeffe and M. McCarthy (eds), The Routledge Handbook of Corpus Linguistics, Routledge: 107–121.
  • McEnery, T., Xiao, R. & Tono, Y. (2006). Corpus-based language studies: an advanced resource book. Taylor & Francis.
  • McEnery, T. & Hardie, A. (2011). Corpus linguistics: method, theory and practice. Cambridge University Press.
  • Oostdijk, N. (1991) Corpus Linguistics and the automatic analysis of English. GA: Rodopi
  • O’Sullivan, I. (2007) ‘Enhancing a process-oriented approach to literacy and language learning: The role of corpus consultation literacy’, ReCall, 19(3), 269–286.
  • Özkan, B. (2013). Yöntem ve uygulama açısından “Türkiye Türkçesi söz varlığının derlem tabanlı sözlüğü”. Bilig, 66, 149-178.
  • Özkan, B. (2020) Terim bilim çalışmalarında derlem kullanımı ve “kendi kendine derlem oluşturma platformu” terim bilim modülü. Avrasya Terim Dergisi, 8(1), 8-17.
  • Sinclair, J. (2005). Meaning in the framework of corpus linguistics. Lexicographica, 20(2005), 20- 32.
  • Sert, G. (2018). Anlam alanı ve anlam ezgisi açısından eş anlamlı durum sıfatları (derlem tabanlı bir inceleme). [Yayımlanmamış doktora tezi], Eskişehir Osmangazi Üniversitesi Sosyal Bilimler Enstitüsü.
  • Sezer, B. & Sezer, T. (2013). TS corpus: herkes için Türkçe derlem. In Proceedings of the 27th national linguistics conference. 217-225.
  • Şimşek, R. (2020). Subliminal bir güç göstergesi: yabancı dil olarak Türkçe öğretimi ders kitapları [Yayımlanmamış doktora tezi]. İnönü Üniversitesi, Eğitim Bilimler Enstitüsü.
  • Şimşek, R. & Gün, M. (2021). A corpus-based proposal for the vocabulary to be taught at a1 level in the teaching of turkish as a foreign language. Educatıonal Polıcy Analysıs And Strategıc Research, 16(1), 356-373. https://dx.doi.org/10.29329/epasr
  • Özkan, B. (2010). Türkçenin öğretiminde sifatlarin eşdizim sözlüğü: yöntem ve uygulama. eUluslararası Eğitim Araştırmaları Dergisi, 1(2), 51-65.
  • Özkan, B. (2014). Türkiye Türkçesi söz varlığında fiillerin derlem denetimi ve derlem tabanlı sözlüğü. Bilig, (69), 171-204.
  • Özkan, B., Tahiroğlu, B. T. & Özkan, A. E. (eds.). (2014). Türkçe üzerine derlem dilbilim uygulamaları. Karahan Kitabevi.
  • Tahiroğlu, B.T. (2010). Bilgisayar destekli sözlük bilimi çalışmalarında derleme sözlüğü veri tabanı örneği [Yayımlanmamış doktora tezi]. Çukurova Üniversitesi Sosyal Bilimler Enstitüsü.
  • Teubert, W. & Čermáková, A. (2004). Directions in corpus linguistics. Lexicology and corpus linguistics, 113-166.
  • Tognini-Bonelli, E. & Sinclair, J. (2006) ‘Corpora’, in K. Brown (ed), Encyclopedia of Language and Linguistics, Elsevier: 216–219.
  • Tüfekçioğlu, B. (2013). Derlem tabanlı çevrim içi Türkçe öğrenci sözlüğü: önadlar A madde başı. [Yayımlanmamış yüksek lisans tezi]. Mersin Üniversitesi Eğitim Bilimleri Enstitüsü.
  • Tüfekçioğlu, B. (2018). Yabancı dil olarak akademik Türkçe: Sosyal bilimlerde akademik ve teknik söz varlığı. [Yayımlanmamış doktora tezi]. Hacettepe Üniversitesi, Türkiyat Araştırmaları Enstitüsü.
  • Tüfekçioğlu, B. (2021). Cultural vocabulary in teaching Turkish as a foreign language. Eurasian Journal of Applied Linguistics, 7(1), 338-358. https://dx.doi.org/10.32601/ejal.911449