Türkçe metinden konuşma sentezleme uygulamaları için bir veri sözlük seti ve yazılım çerçevesi

Bu çalışmada, Türkçe metinden konuşma sentezleme uygulamaları için altyapı sağlayacak olan bir veri sözlük seti ve yazılım çerçevesi tanıtılmaktadır. Söz konusu altyapı, Microsoft.NET 2.0 ortamında geliştirilmiş fonksiyonlar ve XML tabanlı kural betiklerinden oluşmaktadır. Altyapı fonksiyonları, verilen bir metnin doğru fonetik gösteriminin yapılabilmesi; metin içerisindeki kısaltmaların, sayısal değerlerin doğru bir şekilde okunabilmesi için uygun şekilde yazılı hale dönüştürülmesi vb. görevleri yerine getirmektedir. Bu çalışma kapsamında, fonetik gösterim için özel bir sembol kümesi de tanımlanmış olup bu makalede detaylı olarak tanımlanmıştır. Altyapının, gelecekte yapılacak olan metinden konuşma sentezleme uygulamaları için standardizasyon sağlaması hedeflenmektedir.

A lexicon set and software framework for Turkish text-to-speech synthesis applications

In this work a lexicon set and software framework, which will provide an infrastructure for Turkish text-tospeech synthesis applications, are introduced. The infrastructure consists of functions developed at Microsoft.NET 2.0 environment and XML based rule scripts. The infrastructure functions perform operations such as the correct phonetic representation of a given text; the conversions of acronyms and abbreviations or numerical values inside a text to appropriate written form for correct speech synthesis, etc. In scope of this study, a proprietary phonetic representation has also been defined, and it is described in details in this paper. It is aimed that the infrastructure will provide standardization for the future text-to-speech applications.

___

  • 1. Klatt, D. H., “Review of text-to-speech conversion for English”, Journal of the Acoustical Society of America, Cilt 82, 737 – 793, 1987.
  • 2. Özüm, İ. Y., A Speech Synthesis System for Turkish Language Based on the Concetanation of Phonemes taken from Speaker, Yüksek Lisans Tezi, Orta Doğu Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 1993.
  • 3. Erer, M. S., Karma Söz Üretme Yöntemi ile Türkçe Yazılı Metinden Söze Geçme, Yüksek Lisans Tezi, İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 1994.
  • 4. Güven, K., PC Based Speech Synthesis for Turkish, Yüksek Lisans Tezi, Çukurova Üniversitesi, Fen Bilimleri Enstitüsü, 1994.
  • 5. Öztaner, S. M., A Word Grammar of Turkish with Morphophonemic Rules, Yüksek Lisans Tezi, Orta Doğu Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 1996.
  • 6. Ayhan, K., Text-to-speech Synthesizer in Turkish Using Non Parametric Techniques, Yüksek Lisans Tezi, Orta Doğu Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 1998.
  • 7. Salor, Ö., Signal Processing Aspect of Text to Speech Synthesizer in Turkish, Yüksek Lisans Tezi, Orta Doğu Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 1999.
  • 8. Bozkurt, B., Reading Aid for Visually Impaired (A Turkish Text-to-Speech System Development), Yüksek Lisans Tezi, Boğaziçi Üniversitesi, Biyomedikal Mühendislik Enstitüsü, 2000.
  • 9. Abdullahbeşe, E., Fundamental Frequency Contour Synthesis for Turkish Text-to-Speech, Yüksek Lisans Tezi, Boğaziçi Üniversitesi, Fen Bilimleri Enstitüsü, 2001.
  • 10. Eker, B., Turkish Text to Speech System, Yüksek Lisans Tezi, Bilkent Üniversitesi, Mühendislik ve Fen Bilimleri Enstitüsü, 2002.
  • 11. Özen, Ş. S., Türkçe Metinden Konuşma Sentezleme, Yüksek Lisans Tezi, Hacettepe Üniversitesi, Fen Bilimleri Enstitüsü, 2002.
  • 12. Şayli, Ö., Duration Analysis and Modelling for Turkish Text-To-Speech Synthesis, Yüksek Lisans Tezi, Boğaziçi Üniversitesi, Fen Bilimleri Enstitüsü, 2002.
  • 13. Vural, E., A Prosodic Turkish Text-to-Speech Synthesizer, Yüksek Lisans Tezi, Sabancı Üniversitesi, Mühendislik ve Doğa Bilimleri Enstitüsü, 2003.
  • 14. Aktan, O., A Single Chip Solution for Text-to- Speech Synthesis, Yüksek Lisans Tezi, Boğaziçi Üniversitesi, Fen Bilimleri Enstitüsü, 2004.
  • 15. Sak, H., A Corpus Based Concenative Speech Synthesis System for Turkish, Yüksek Lisans Tezi, Boğaziçi Üniversitesi, Fen Bilimleri Enstitüsü, 2004.
  • 16. Karlı, A., Örnek Bir Dizi Cümle İçin Türkçe Metinden Konuşma Sentezleyici, Yüksek Lisans Tezi, Ankara Üniversitesi, Fen Bilimleri Enstitüsü, 2005.
  • 17. Ünaldı, İ., Taşınabilir Cihazlar için Türkçe Metinden Konuşma Sentezleme Sistemi, Yüksek Lisans Tezi, Hacettepe Üniversitesi, Fen Bilimleri Enstitüsü, 2007.
  • 18. Külekçi, M. O., Statistical Morphological Disambiguation with Application to Disambiguation of Pronunciations in Turkish, Doktora Tezi, Sabancı Üniversitesi, Fen Bilimleri Enstitüsü, 2006.
  • 19. Bozkurt, B. ve Dutoit, T., “An Implementation and Evaluation of Two-Diphone Based Synthesizers for Turkish”, 4th ISCA Tutorial and Research Workshop on Speech Synthesis, 247-250, Blair Atholl, İskoçya, 29 Ağustos-1 Eylül 2001.
  • 20. Şayli, Ö., Arslan, L. M. ve Özsoy, A. S., “Duration Properties of the Turkish Phonemes”, 11th International Conference on Turkish Linguistics (ICTL 2002), Doğu Akdeniz Üniversitesi, Gazimağusa, K.K.T.C., 7-9 Ağustos 2002.
  • 21. Bozkurt, B., Ozturk, O. ve Dutoit, T., "Text Design for TTS Speech Corpus Building Using a Modified Greedy Selection", Eurospeech 2003, 277-280, Geneva, İsviçre, 1-4 Eylül 2003.
  • 22. Oflazer, K. ve Inkelas, S., “A Finite State Pronunciation Lexicon for Turkish”, EACL Workshop on Finite State Methods in NLP, Budapeşte, Macaristan, 13-14 Nisan 2003.
  • 23. Öztürk, Ö. ve Çiloğlu, T., “Türkçe Metinden Konuşma Sentezleme için Sesbirim Sürelerinin Modellenmesi”, IEEE Sinyal İşleme ve İletişim Uygulamaları Konferansı (SİU-2004), 272-275, Kuşadası, Türkiye, 28-30 Nisan 2004.
  • 24. Arısoy, E., Arslan, L. M., Demiralp, M. N., Ekenel, H. K., Kelepir, M., Meral, H. M., Özsoy, A. S., Şayli, Ö., Türk, O. ve Can-Yolcu, B., “Duration of Turkish Vowels Revisited”, 12th International Conference on Turkish Linguistics (ICTL 2004), Dokuz Eylül Üniversitesi, İzmir, Türkiye, 11-13 Ağustos 2004.
  • 25. Sak, H., Güngör, T. ve Safkan, Y., “Generation of Synthetic Speech from Turkish Text”, 13th European Signal Processing Conference (EUSIPCO 2005), Antalya, Türkiye, 4-8 Eylül 2005.
  • 26. Türk, O., Schröder, M., Bozkurt, B. ve Arslan, L. M., “Voice Quality Interpolation for Emotional Text-to-Speech Synthesis”, 9th European Conference on Speech Communication & Technoloy (Interspeech 2005), Lizbon, Portekiz, 4-8 Eylül 2005.
  • 27. Aşlıyan, R. ve Günel, K., “Türkçe Metinler için Hece Tabanlı Konuşma Sentezleme Sistemi”, Akademik Bilişim (AB’08), On Sekiz Mart Üniversitesi, Çanakkale, Türkiye, 30 Ocak-1 Şubat 2008.
  • 28. Oflazer, K. ve Inkelas, S., “The Architecture and the Implementation of a Finite State Pronunciation Lexicon for Turkish”, Computer Speech and Language, Cilt 20, No 1, 80-106, 2006.
  • 29. Öğüt, F., Kiliç, M. A., Engin, E. Z. ve Midilli, R., "Voice Onset Times for Turkish Stop Consonants", Speech Communication, Cilt 48, 1094–1099, 2006.
  • 30. Sak, H., Güngör, T. ve Safkan, Y., “A Corpus Based Concenative Speech Synthesis System for Turkish”, Turkish Journal of Electrical Engineering and Computer Science, Cilt 14, No 2, 209-223, 2006.
  • 31. Demircan, Ö., Türkiye Türkçesinin Ses Düzeni, Türkiye Türkçesindeki Sesler, Türk Dil Kurumu Yayınları, Ankara, 1979.
  • 32. Özkan, M., Türkçenin Ses ve Yazım Özellikleri, Filiz Kitabevi, İstanbul, 2001.
  • 33. Ergenç, İ., Spoken Language and Dictionary of Turkish Articulation, Multilingual Yabancı Dil Yayınları, İstanbul, 2002.
  • 34. User, H. Ş., Başlangıcından Günümüze Türk Yazı Sistemleri, Akçağ Yayınları, Ankara, 2006.
  • 35. Salor, Ö., Pellom, B. L., Ciloglu, T. ve Demirekler, M., “Turkish Speech Corpora and Recognition Tools Developed by Porting SONIC: Towards Multilingual Speech Recognition”, Computer Speech and Language, Cilt 21, 580- 593, 2007.
  • 36. Zülfikar, H., Doğru Yazalım, Doğru Okuyalım, Türk Dil Kurumu - Rapor, Ağustos 1999.
  • 37. SAMPA (Speech Assessment Methods Phonetic Alphabet) - Computer Readable Phonetic Alphabet, Çevrimiçi http://www.phon.ucl.ac.uk/home/sampa/, Son Erişim Tarihi: 21.01.2009.
  • 38. Computer-Coding the IPA: A Proposed Extension of SAMPA, Çevrimiçi http://www.phon.ucl.ac.uk/home/sampa/xsampa. htm, Son Erişim Tarihi: 21.01.2009.
  • 39. Sezer, E., “On Non-Final Stress in Turkish”, Journal of Turkish Studies, Cilt 5, 61–69, 1983.
  • 40. Kabak, B. ve Vogel, I., “The phonological word and stress assignment in Turkish”, Phonology, Cilt 18, 315–360, 2001.
  • 41. Inkelas, S. ve Orgun, C. O., “Turkish Stress: A Review”, Phonology, Cilt 20, 139-161, 2003.
  • 42. Kabak, B., “Hiatus resolution in Turkish: An underspecification account”, Lingua, Cilt 117, 1378-1411, 2007.
  • 43. Charette, M., “The Vital Role of the Trochaic Foot in Explaining Turkish Word Endings”, Lingua, Cilt 118, 46-65, 2008.