Türkçe Tümce Çözümlemede Vektör Yaklaşımı

Tümcenin anlamsal ve dilbilgisi açısından çözümlenmesi Doğal Dil  İşleme (DDİ)nin ana konulardan biridir. Çalışmamızda, tümcedeki temel dilbilgisi ve anlamsal yanlışları saptamak için yüklemi temel alan yeni bir yöntem önerilmektedir. Türkçe tümcede yüklem özne ve zaman bilgisi içerir. Ayrıca yüklem, o tümcenin hangi öbeklerden oluşabileceği konusunda da belirleyicidir. Örneğin, büyümek yüklemi tümce içinde nesne almazken, ‐de ekiyle biten dolaylı tümleç öbeğini alır. Yüklem ayrıca her bir öbeğin içereceği kavram hakkında da bilgi içermektedir. Örneğin düşünmek yüklemi insanlara özgüdür. Dolayısıyla özne olarak insan kavramıyla ilişkilidir. Bu saptamalardan yola çıkarak çalışmamızda, tümcelerin öbekleri bulunmuş; her bir öbeğin hangi kavramla ilişkili olduğu belirlenmiş  ve tümcenin dilbilgisi çözümlemesini ve anlam çözümlemesini yapan bir model tasarlanmıştır.

Vectorial Approach For Analysing Turkish Sentence

The grammatical and semantic analysis of the sentence is one of the main subjects of Natural Language Processing (NLP). In this paper, we present a novel method to detect basic grammatical and semantic disorders by concentrating on the predicate. In Turkish, the predicate includes information about the subject and tense. The predicate also helps identify the phrases which make up the sentence. For example, büyümek (to grow) does not take an object, but it can take a locative phrase ending with the suffix ‐de . The predicate is also informative about the semantic concept of a phrase. For exampledüşünmek (to think) is specifically an action performed by a human, so the subject will be related with the concept of a human. With these properties considered, a model has been designed to find phrases in a sentence, identify their relations to specific concepts, and analyze the sentences grammatically and semantically.

___

  • Dilsiz, S., 2015. Bulanık mantık ve yapay sinir ağları ile Türkçe yazım denetleyicisi. Yüksek Lisans Tezi, İstanbul Teknik Üniversitesi Fen Bilimleri Enstitüsü, İstanbul.
  • Eryiğit, G., 2014.  İTÜ Turkish NLP web service. EACL 2014, 1.
  • Felice, M., et al., 2014. Grammatical error correction using hybrid systems and type filtering. CoNLL‐2014, 15‐16.
  • Lee, K. and Lee, G. G., 2014. POSTECH Grammatical Error Correction System in the CoNLL‐2014 Shared Task. CoNLL‐2014, 65.
  • Ng, H. T., et al., 2014. The conll‐2013 shared task on grammatical error correction. In Proceedings of the Eighteenth Conference on Computational Natural Language Learning: Shared Task, 1‐12.
  • Wang, Y.,    et al., 2014. Factored statistical machine translation for grammatical error correction. CoNLL‐ 2014, 83.
  • Aygül, M., Karaalioğlu, G. and Amasyalı, M. F., 2014. Prediction of function tags of the simple Turkish sentences by conditional random fields. Sigma, 32, 23‐30.
  • Isguder, G. G. and Adali, E., 2014. A pilot study on automatic inference rule discovery from Turkish text. In Application of Information and Communication Technologies, 1‐5.
  • Cambria, E., et al., 2013. Big social data analysis. Big data computing, 401‐414.
  • Ehsan, N. and Faili, H., 2013. Grammatical and context‐sensitive error correction using a statistical machine translation framework. Software: Practice and Experience, 43, 187‐206.
  • Procter, R., Vis, F. and Voss, A., 2013. Reading the riots on Twitter: methodological innovation for the analysis of big data. International Journal of Social Research Methodology, 16, 197‐214.
  • Haaparanta, L. and Hintikka, J., 2012. Frege synthesized: essays on the philosophical and foundational work of Gottlob Frege. Springer Science & Business Media, Vol. 181.
  • Chodorow, M., et al., 2012. Problems in Evaluating Grammatical Error Detection Systems. COLING, 611‐ 628.
  • Doğan, S. and Karaağaç, G., 2012. Dilbilgisel Bağdaşmazlık ve Anlamsal Tutarsızlık. İstanbul Aydın Üniversitesi Dergisi, 16, 25‐ 42.  
  • Amasyalı, M. F., 2012. Kavramlar Arası Anlamsal İlişkilerin Türkçe Sözlük Tanımları Kullanılarak Otomatik Olarak Çıkartılması. EMO Bilimsel Dergi, 1, 1‐14.
  • Kurumu, T. D., 2010. Büyük Türkçe sözlük. TDK. Ankara. Bentivogli, L., et al., 2009. The fifth pascal recognizing textual entailment challenge. Proceedings of TAC, 9, 14‐24.
  • Demirgüneş, S., 2008. Türkçedeki Zaman Belirteçlerinin Sınıflaması ve Dökümü Üzerine Bir Deneme Çalışması. Turkish Studies, 2, 278‐293.
  • Padó, S., et al., 2008. Deciding entailment and contradiction with stochastic and edit distance‐based alignment. In Proceedings of the Text Analysis Conference, Vol. 4.
  • Eryiğit, G., Nivre, J. and Oflazer, K., 2008. Dependency parsing of Turkish. Computational Linguistics, 34, 357‐389.
  • Delibas, A., 2008. Doğal Dil  İşleme  İle Türkçe Yazım Hatalarının Denetlenmesi. Doktora Tezi,  İstanbul Teknik Üniversitesi Fen Bilimleri Enstitüsü, İstanbul. Giampiccolo, D., et al., 2007. The third pascal recognizing textual entailment challenge.
  • In Proceedings of the ACL‐PASCAL workshop on textual entailment and paraphrasing. Association for Computational Linguistics, 1‐9.
  • Güngör, O. and Güngör, T., 2007. Türkçe bir sözlükteki tanımlardan kavramlar arasındaki üst‐kavram ilişkilerinin çıkarılması. Akademik Bilişim Konferansı, 1, 1‐13.
  • Kalkan, U., 2006. Türkiye Türkçesinde Hal (Durum) Kavramı ve Hal (Durum) Eklerinin İşlevleri. Aliyeva, H., 2004. Türkiye Türkçesinde  İsim Hâlleri ve Nesnenin  İfade Vasıtaları. V. Uluslararası Türk Dili Kurultayı, 157‐164.
  • Bilgin, O., Çetinoğlu, Ö. and Oflazer, K., 2004. Building a wordnet for Turkish. Romanian Journal of Information Science and Technology, 7, 163‐172.
  • Izumi, E., et al., 2003. Automatic error detection in the Japanese learners' English spoken data. InProceedings of the 41st Annual Meeting on Association for Computational Linguistics, 2, 145‐ 148.
  • Oflazer, K., 2003. Dependency parsing with an extended finite‐state approach. Computational Linguistics, 29, 515‐544.
  • Chomsky, N., 2002. Syntactic structures. Walter de Gruyter.
  • Stamou, S., et al., 2002. Balkanet: A multilingual semantic network for the balkan languages. In Proceedings of the International Wordnet Conference, 21‐25.
  • Cebiroğlu, G., 2002. Sözlüksüz Köke Ulaşma Yöntemi. Doktora Tezi, İstanbul Teknik Üniversitesi Fen Bilimleri Enstitüsü, İstanbul.
  • Bigert, J. and Knutsson, O., 2002. Robust error detection: A hybrid approach combining unsupervised error detection and linguistic knowledge. In Proc. 2nd Workshop Robust Methods in Analysis of Natural language Data, 10‐19.
  • Fellbaum, C., 1998. WordNet. Blackwell Publishing Ltd. Hoffman, B., 1995. The computational analysis of the syntax and interpretation of "free" word order in Turkish. IRCS Technical Reports Series, 130. Baytop, T., 1994. Türkce bitki adlari sözlügü. Türk tarih kurumu, 578.
  • Korkmaz, Z., 1994. Türkçede eklerin kullanılış şekilleri ve ek kalıplaşması olayları. Türk Dil Kurumu,  Vol. 598. Levin, B., 1993. English verb classes and alternations: A preliminary investigation. University of Chicago press.
  • Lakoff, G., 1990. Women, fire, and dangerous things: What categories reveal about the mind. University of Chicago press, 1987‐1987.
  • Atwell, E. S., 1987. How to detect grammatical errors in a text without parsing it. In Proceedings of the third conference on European chapter of the Association for Computational Linguistics, 38‐45.
  • Banguoğlu, T., 1974. Türkçenin grameri. Baha Matbaası. Bybee, J. L., 1985. Morphology: A study of the relation between meaning and form. John Benjamins Publishing, Vol. 9.
  • Backus, J. W., 1959. The syntax and semantics of the proposed international algebraic language of the Zurich ACM‐GAMM conference. Proceedings of the International Comference on Information Processing.
Afyon Kocatepe Üniversitesi Fen ve Mühendislik Bilimleri Dergisi-Cover
  • Yayın Aralığı: Yılda 6 Sayı
  • Başlangıç: 2015
  • Yayıncı: AFYON KOCATEPE ÜNİVERSİTESİ