TÜRKÇE’DE KULLANILAN İŞLEV KELİMELERİN ZİPF 1. KANUNU ESASINDA DEĞERLENDİRİLMESİ

Bu çalışmada doğal dil içinde gramer yapısının oluşturulması amacıyla kullanılan, içinde bulunduğu metnintaşıdığı enformasyon miktarını değiştirmeyen kelimeler (işlev kelimeler) araştırılmıştır. Araştırmanın temeliniZipf’in 1. Kanunu’nun Türkçe metinler üzerinde sınanması ve yüksek frekanslı kelimelerin işlev kelime olacağı beklentisi oluşturmaktadır. Çalışmada önerilen yöntem ile ilgili testler Türkçe metinler içeren farklı derlemler üzerinde yapılmış, sonuçlar değerlendirilmiştir.

___

  • Kornai, A., How many words are there?,
  • Glottometrics 2002/4, 61-86p., 2002.
  • Zipf, G. K., Human Behaviour and the
  • Principles of Least Effort, Cambridge, MA,
  • Addison-Wesley, 1949.
  • Manning, C.D., Schütze, H., Foundations of
  • Statistical Natural Language Processing.
  • The MIT Press, Cambridge, Massachusetts,
  • London, England, 2003.
  • Hakkani-Tür, D.Z., Oflazer, K., and Tür, G.,
  • Statistical morphological disambiguation for
  • agglutinative languages, International
  • Conference On Computational Linguistics,
  • Proceedings of the 18th conference on
  • Computational Linguistics - Volume 1,
  • Saarbrücken, Germany, 285 - 291 , 2000.
  • Dinçer, T., Türkçe için İstatistiksel Bir Bilgi Gerigetirim
  • Sistemi, Doktora Tezi, U.B.E.,Ege
  • Üniversitesi, 2004.
  • Tuldava, J., A Mathematical Model Of The
  • Vocabulary-Text Relation. COLING 1980, 600-604,
  • -
  • Alpkoçak, A., Kut, A., ve Özkarahan, E., 1995, Bilgi
  • Bulma Sistemleri için Otomatik Dizinleme Yöntemi,
  • Bilişim’95, Dokuz Eylül Üniversitesi, İzmir, 6s.,
  • -
  • Holmes-Higgin, P., Abidi S. R., Ahmad, K., A
  • Description of Texts in a Corpus: 'Virtual' and 'Real'
  • Corpora, EURALEX'94, 1994.
  • Van Rijsbergen, C.J., Information Retrieval (2nd
  • ed.), Butterworths, London, 1979.
  • Argamon, S., Levitan, S., Measuring the Usefulness
  • of Function Words for Authorship Attribution,
  • Proceedings of ACH/ALLC Conference 2005 in
  • Victoria, BC, Canada, 2005.
  • Cleveland, D. B. , Cleveland, A. D., Introduction to
  • indexing and abstracting, Libraries Unlimited, Inc.,
  • Littleton, Colorado, 1983.
  • Baayen, R. H., Word Frequency Distributions,
  • Dordrecht: Kluwer Academic Publishers, 2001.
  • Kumova, S., Derlem Hazırlama Kriterlerinin
  • Oluşturulması, Yüksek Lisans Tezi, U.B.E., Ege
  • Üniversitesi, 2005.
  • Powers, D. M. W., Applications and Explanations of
  • Zipf’s law, NEMLAP3/CONLL98, New methods
  • in language processing and Computational
  • natural language learning, 151-160, 1998.