METİNLERİN OKUNABİLİRLİĞİNİN ÖLÇÜLMESİ ÜZERİNE BİR YAZILIM KÜTÜPHANESİ VE TÜRKÇE İÇİN YENİ BİR OKUNABİLİRLİK ÖLÇÜTÜ

Bu makalede, Doğal Dil İşleme (DDİ)‟nin bir konusu olan okunabilirlik kavramı ve kullanım alanları ele alınmıştır. İngilizce için tanımlanmış olan ve günümüzde farklı alanlarda kullanılan, birbirinden farklı niceliklerle oluşturulmuş okunabilirlik ölçütleri incelenmiştir. Sözkonusu formüllerin Türkçe için uygunlukları ve uyarlanabilirlikleri, geliştirilen bir yazılım kütüphanesi ile farklı türlerde ve seviyelerdeki Türkçe kitap metinleri kullanılarak incelenmiştir. Ayrıca, Türkçe‟nin bir takım istatistiksel özellikleri belirlenerek Türkçe için yeni bir okunabilirlik ölçütü formülü önerilmiştir. C programlama dilinde geliştirilen ve platform bağımsız olarak kullanılabilen söz konusu kütüphanenin, bu konuda çalışacak araştırmacılara bir kaynak olacağı; önerilen okunabilirlik ölçütünün de Türkçe metinlerin seviyesi hakkında fikir vermesi açısından yaygın kullanım alanı bulabileceği öngörülmektedir.

A SOFTWARE LIBRARY FOR MEASUREMENT OF READABILITY OF TEXTS AND A NEW READABILITY METRIC FOR TURKISH

In this article, as a matter of Natural Language Processing, the concept of readability and its possible areas of application have been considered. Readability metrics, which have so far been defined for English by considering different aspects and used in different areas, are investigated quantitatively. Eligibility and applicability of the existing metrics for Turkish have been analyzed via Turkish books of various types and levels by means of a software library developed by ourselves. In addition, statistical characteristics of Turkish were determined and a new readability formula for Turkish is proposed. Being developed with the C programming language with the main feature of platform independency, the software library is expected to serve as a resource for the upcoming researches in this topic; meanwhile the proposed readability metric is expected to find wide application area for prediction of the readability levels of Turkish texts.

___

  • Al-Ajlan A. A., Hend S. A., AbdulMalik S. A. (2008): “Towards the Development of an Automatic Readability Measurements for Arabic Language”, 3rd Int. Conf. Digi. Inf. Mng. (ICDIM), s. 506–511. American Education System, Çevrimiçi:
  • http://www.indobase.com/study abroad/countries/usa/usa-education-system.html Son Erişim Tarihi: 15.07.2010.
  • Ateşman E. (1997): “Türkçede Okunabilirliğin Ölçülmesi”, Dil Dergisi, Cilt 58, s. 71-74.
  • Bozşahin C., Zeyrek D., Pembeci I. (1998): “Computer-aided Learning of Turkish Morphology”, Debrecen, Hungary, Proc. Joint Conf. ACH ALLC.
  • DuBay W. H. (2004): “The Principles of Readability, Impact Information”, Costa Mesa, CA.
  • Flesch R. (1948): “A New Readability Yardstick”, Journal of Applied Psychology, Cilt 32, s. 221-233.
  • Gunning R. (1952): “The Technique of Clear Writing”, McGraw-Hill International Book Co, New York.
  • Hedman A. S. (2008): “Using the SMOG Formula to Revise a Health-Related Document”, American. Journal of Health Education, Cilt 39, Sayı 1, s. 61–64.
  • Ley P. T. (1996): “The Use of Readability Formulas in Health Care”, Psychology, Health & Medicine, Cilt 1, Sayı 1, s. 7-28.
  • McLaughlin G. H. (1969): “SMOG Grading-A New Readability Formula”, Journal of Reading, Cilt 12, Sayı 8, s. 639–646.
  • Senter R. J., Smith E. A. (1967): “Automated Readability Index”, Technical Report, Cincinnati University, Ohio.