Türkiye Türkçesi Söz Varlığında Fiillerin Derlem Denetimi ve Derlem Tabanlı Sözlüğü

Türkiye Türkçesinin Söz Varlığını (TTSV) barındıran sözlükler, sözlükbilimin ilke ve yöntemleri açısından değerlendirildiğinde; sözlükbirimlerin yazımı, madde başı ve içi açıklamalarda eksiklikler, sözlükbirim tanıklarının yetersizliği ve birçok sözlükbirimin sözlükte tanıksız yer alması, sözcük türlerinin etiketlenmesindeki eksiklikler, sözlük malzemesinin gerçek zamanlı olmaması vb. nedenlerle 'genel amaçlı, ansiklopedik' sözlükler oldukları görülür. Bunun nedeni Türkçe için henüz nitelikli, kapsamlı ve standartlara uygun bir derlemin oluşturulamamış olmasıdır. Sözlük çalışmalarımız derlem tabanlı olmaktan uzaktır. Bu açıdan sözlükbilim çalışmalarımızın derlem tabanlı uygulamaların sonuçlarını esas alan, sözlükbirimlerin ve anlamsal sıklıklarının göz önüne alındığı, gerçek zamanlı, kullanıcı temelli anlayıştan uzak bir çerçevede olduğu gözlemlenmektedir. Bu çalışmanın amacı, bugüne kadar sözlüklerde derlenen madde başı fiilleri (MBF) bir derlemden yazımsallıkları, madde başı açıklamaları, tanıkları, sözcük türü olarak etiketleri açısından gerçek zamanlı olarak denetlemek ve sözlük girdilerini bir derlemden elde edilen veriler ışığında düzenlemektir. Çalışma, temelde derlemin oluşturulması, TTSV'de tanımlı 6.374 MBF'nin derlemden tüm yönleriyle toplanması, elde edilen sonuçların yayımlanması olmak üzere üç aşamadan oluşmaktadır. Birinci aşamada, Türkiye Türkçesinin yazın diline ait çeşitli türlerde metin parçaları ile internet ortamından seçilen alana özgü toplam 35 milyon 'söz'lük (+/-) bir derlem amaca uygun bir veri tabanı uygulamasıyla biçimbirimsel, sözcükbirimsel ve tümcesel olarak sayısallaştırılıp sorgulanabilir hâle getirilmiştir. İkinci aşamada, TTSV'de fiillerin söz konusu derlem aracılığıyla derlem denetimi yapılmıştır. Üçüncü aşama ise elde edilen sonuçlar Türkiye Türkçesinde Fiillerin Derlem Tabanlı Sözlüğü olarak sanal ortamda yayımlanmıştır. Bu makale ağırlıklı olarak söz konusu çalışmanın ikinci ve üçüncü aşamasını yöntem ve uygulama açısından tanıtmayı amaçlamaktadır

The Corpus-Check of Verbs and the Corpus-Based Dictionary of Verbs in Turkey Turkish Lexicon?*

When the dictionaries of Turkey Turkish lexicon are taken into consideration, it can be said that these dictionaries function mainly as encyclopedias or general dictionaries. One of the reasons is that there are problems about the textual elements, lexical entries, and the inadequacy of lexicographic evidence. Another reason is that there is not a qualified corpus created according to standards and scopes. As a matter of fact, dictionary studies are not in line with a corpus. From this perspective, lexicography studies are not in line with the results of corpus-based data about the frequencies of meaning; moreover, they are neither spontaneous nor user-friendly. The aim of the present study is not only to examine the textual elements, explanations, lexicographic evidence and part of speech tags for the verbs from a corpus spontaneously, but also to design the data in accordance with the corpus data. The study is composed of three steps, which are: creating the corpus, the compiling of 6.374 verbs in the corpus with all of their properties in Turkey Turkish lexicon, and publishing the results. As for the first step, 35 million words (+/-), which are domain specific and gathered from different texts as well as the internet, have been digitized and made ready for search in terms of morphemic, lexicographical and sentential aspects. For the second step, the corpus check of the verbs in Turkey Turkish lexicon has been conducted. Finally, the obtained results have been published online as "CorpusBased Dictionary of Verbs in Turkey Turkish" This article particularly aims to introduce the techniques and application of the second and third steps and share the results of the project.

___

Atkins, Sue (2003). "Lexicographic Relevance: Selecting Information from Cor- pus Evidence". International Journal of Lexicography 16 (3): 251-280.

Baker, Paul vd. (2006). A Glossary of Corpus Linguistics. UK: Edinburg University Press.

Biber, Douglas vd. (2002). Corpus Linguistics, Investigating Language Structure and Use. UK: Cambridge University Press.

http://fiiller.mersin.edu.tr/. [Erişim: 10.11.2011].

http://info.ox.ac.uk/bnc/. [Erişim: 23.10.2010].

http://mistug.tubitak.gov.tr/proje/. [Erişim: 4.03.2014].

http://turkcederlem.mersin.edu.tr/. [Erişim: 10.11.2011].

http://turkcederlem.mersin.edu.tr/derlem516/. [Erişim: 10.11.2011].

http://www.hlst.sabanciuniv.edu/TL/. [Erişim: 19.10.2010].

http://www.tdk.gov.tr/index.php?option=com_gts&view=gts. [Erişim 10.11.2011].

http://www.tnc.org.tr/. [Erişim: 16.4.2011].

Kennedy, Graeme (1998). An Introduction to Corpus Linguistics. New York: Addi- son Wesley Longman Limited.

Krishnamurthy, Ramesh (2008). "Corpus-driven Lexicography". International Journal of Lexicography 21(3): 231-242.

McEnery, Tony and Adrrew Wilson (2004). Corpus Linguistics -An Introduction-. USA: Edinburg Universitiy Press.

McEnery, Tony vd. (2006). Corpus-Based Language Studies An Advanced Resource Book. New York: Routledge.

Özkan, Bülent ve Ayşe Eda Gündoğdu (2011). "Ana Dili ve Yabancı Dil Olarak Türkçenin Öğretiminde Belirteçler -Derlem Tabanlı Bir Uygulama-". Theoretical and Applied Researches on Turkish Language Teaching. Ed. L. Uzun, Ü. Bozkurt. Almanya: Die Blaue Eule. Essen. 317-336.

____, (2010a). "Türkçenin Öğretiminde Sıfatların Eşdizim Sözlüğü: Yöntem ve Uygulama". E-Uluslararası Eğitim Araştırmaları Dergisi 1(2): 51-65.

____, (2010b). "Güncel Türkçe Sözlükte Zarf Olarak Tanımlı Sözlükbirimlerin Derlem Denetimi". Turkish Studies International Periodical for the Lan- guages, Literature and History of Turkish or Turkic 5(3): 1764-1782.

_____, (2012). Türkiye Türkçesinde Fiillerin Derlem Denetimi ve Derlem Tabanlı Sözlüğü. TÜBİTAK-SOBAG Proje Sonuç Raporu. (Proje No: 109K516) Ankara. (http://mistug.tubitak.gov.tr/proje/).

Sampson, Geoffrey and Diana McCarthy (2005). Corpus Linguistics: Reading in a Widening Discipline. New York: Continuum.

Say, Bilge (2003). Türkçe için Biçimbirimsel ve Sözdizimsel Olarak İşaretlenmiş Ağaç Yapılı Bir Derlem Oluşturma. Proje Raporu. EK-B: Türkçe Ağaç Yapılı Derlem Kılavuzu (Proje No: 199E026). Ankara.

Say, Bilge vd. (2002). "Bilgisayar Ortamında Derlem Geliştirme Çalışması". Akademik Bilişim Konferansı. Konya.

Summers, D. (1993). "Longman/Lancaster English Language Corpus - Criteria and Design". International Journal of Lexicography 6(3): 181-208.

Tahiroğlu, B. Tahir (2006). Bilgisayar Destekli Dil Bilimi Çalıştayı Bildirileri. Ankara: TDK Yay. 89-98.

Türkçe Sözlük (2005). Ankara: TDK Yay.

___