Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması

Basılı belge ya da görüntülerdeki karakterlerin okunarak, düzenlenebilir metinler haline getirilmesi Optik Karakter Tanıma (OKT) yöntemleriyle gerçekleştirilmektedir. Karakter tanıma yöntemlerinin temelinde görüntü işleme basamakları vardır. İlk olarak basılı belgelerin veya görüntülerin bir kamera ya da tarayıcı yardımıyla sayısal ortama aktarılması gerekmektedir. Ancak belge görüntülerinin elde edilirken ışık, gölge ve arka plan gibi çevresel parametrelere dikkat edilmediğinde karakter tanıma zor olmaktadır. Ayrıca yine belge ya da görüntülerin, eğik olarak sayısal ortama aktarılmasıyla, karakterlerde meydana gelen eğiklikler, el yazısıyla karakterlerde oluşan eğiklikler ya da italik (eğik) biçimli karakterlerdeki eğiklikler OKT tanıma başarısını olumsuz etkilemektedir. Günümüzde birçok açık ya da kapalı kaynak kodlu OKT yazılım uygulaması vardır. Tesseract en yaygın kullanılan ve karakter tanıma başarısı yüksek olan açık kaynak kodlu yazılımdır. Bu çalışmada, açık kaynak kodlu Tesseract karakter tanıma yazılımının eğik karakter tanıma başarısını arttırmaya yönelik, bir görüntü işleme yöntemi geliştirilmiştir. Geliştirilen yöntem, Dithering (Titreşim) görüntü işleme algoritmasının 4x1 boyutlu yatay biçime dönüştürülmesiyle elde edilmiştir. Yapılan testlerde, Arial ve Times New Roman yazı stillerinin eğik biçimli karakterleri kullanılmıştır. Birbirine benzeyen 429 karakter üzerinde yapılan test sonucunda, geliştirilen yöntemin %33’e varan oranlarda, Tesseract yazılımının başarısını arttırdığı görülmüştür.

Using a New Method to Improve Italic Character Recognition Success

___

  • [1] Patel, C., Patel, A., Patel, D., “Optical Character Recognition by Open Source OCR Tool Tesseract: A Case Study”, International Journal of Computer Applications, 2012, 55(10), 50-56.
  • [2] Shahreza, S.S., Shalmani, M.T.M., Shahreza, M.H.S., “Preparing Persian/Arabic Scanned Images for OCR”, 2nd International Conference on Information & Communication Technologies, Damascus, Syria, 2006.
  • [3] Shen, M., Lei, H., “Improving OCR Performance with Background Image Elimination”, 12th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD), Zhangjiajie, China, 2015.
  • [4] Kessi, L., Lebourgeois, F., Garcia, C., “An Efficient New PDE-based Characters Reconstruction After Graphics Removal”, 15th International Conference on Frontiers in Handwriting Recognition (ICFHR), Shenzhen, China, 2016.
  • [5] Sharma, P., Sharma, S., “Image Processing based Degraded Camera Captured Document Enhancement for Improved OCR Accuracy”, 6th International Conference - Cloud System and Big Data Engineering (Confluence), Noida, India, 2016.
  • [6] Chan, W. T., Lo, T. Y., Tso, C. P., Sim, K. S., “A Method in Applying OCR in Processing of Thermal Images”, 2011 IEEE International Conference on Signal and Image Processing Applications (ICSIPA), Kuala Lumpur, Malaysia, 2011.
  • [7] Sharma, P., Sharma, S., Priambada, S., Widyantoro, D. H., “Levensthein Distance as a Post-Process to Improve the Performance of OCR in Written Road Signs”, 6’th International Conference - Cloud System and Big Data Engineering (Confluence), Noida, India, 2016.
  • [8] Saray, T., Çetinkaya, A., Okatan, A., “Optik Karakter Tanıma Yöntemi ile Otomatik Tabela Okuyucu”, International Conference on Computer Science and Engineering (UBMK), Antalya, Turkey, 2017.
  • [9] Şenyıldız, A., Dirican, A. C., “Görüntü İşleme Teknikleri ve Akıllı Telefon Kullanarak Nüfus Cüzdanı Tespiti ve Otomatik Bilgi Çıkarılması”, Düzce, Türkiye, 2016.
  • [10] Karasu, K., Baştan, M., “Mobil Cihaz ve Tarayıcı Görüntülerinde Türkçe Karakter Tanıma”, 23 nd Signal Processing and Communications Applications Conference (SIU), Malatya, Türkiye, 2015.
  • [11] Ahmet Nusret Özalp, A. N., Dügenci, M., “Plaka Tanıma Sistemlerine Yeni Yaklaşımlar”, Akademik Bilişim’11 - XIII. Akademik Bilişim Konferansı Bildirileri, Malatya, Türkiye, 2011.
  • [12] Saber, S., Ahmed, A., Hadhoud, M., “Robust Metrics for Evaluating Arabic OCR Systems”, International Image Processing, Applications and Systems Conference, Sfax, Tunisia, 2014.
  • [13] Avi-Itzhak, H. I., Diep, T. A., Garland, H., “High Accuracy Optical Character Recognition Using Neural Networks with Centroid Dithering”, IEEE Transactions On Pattern Analysis and Machine Intelligence, 1995, 17(3)-218-224.
  • [14] Ulichney, R., “One-dimensional Dithering”, Cambridge Research Lab, Tecnical Report Series, CRL 98/2, Cambridge, USA, 1998.
  • [15] Ronja's Shader Tutorials, Dithering, [Online] https://www.ronja-tutorials.com/2019/05/11/dithering.html, June 11, 2020.
  • [16] Wolberg, C., “Digital Halftoning”, Image Processing Course Notes, The City College of The University of NewYork Department of Computer Science, NewYork, USA, 2020.
  • [17] Christou, C.N., “Optimal Dither and Noise Shaping in Image Processing”, University of Waterloo, Ontario, Canada, 2008.
  • [18] Cornel., D., Tobler. R. F., Sakai, H., Luksch, C., Wimmer, M., “Forced Random Sampling Fast Generation of Importance-Guided Blue-Noise Samples”, 2017, 33, 833-843.
  • [19] Smith, R., “An Overview of the Tesseract OCR Engine”, Ninth International Conference on Document Analysis and Recognition (ICDAR 2007), Parana, Brazil, 2007.
  • [20] 2020 GitHub, Inc., Tesseract OCR, [Online] https://github.com/tesseract-ocr/tesseract, June 20, 2020.
  • [21] Shafait, F., Breuel, T., Keysers, D., “Efficient Implementation of Local Adaptive Thresholding Techniques Using Integral Images”, 5th Document Recognition and Retrieval Conference, part of the IS&T-SPIE Electronic Imaging Symposium, San Jose, CA, USA, 2008.