Model ve Veri Odaklı Yaklaşımlar ile Nesne Tespit Başarısının Arttırılmasına Yönelik ESA ve Veri Seti Optimizasyonları

Nesne tespit ve sınıflandırma yöntemlerinin başarısının artırılması amacıyla model odaklı ve veri odaklı yaklaşımlar araştırmacılar tarafından son yıllarda sıklıkla çalışılmaktadır. Araştırmacıların birçoğu problemlere özgü model önerilerinde bulunmakta ve mevcut modeller üzerinde değişimler önermektedir. Öte yandan, eğitim sürecinde kullanılmakta olan veri üzerinde yapılan çalışmaların sayışa oldukça azdır. Bu çalışmada, mevcut bir tanıma ve sınıflandırma problemi üzerinde, model ve veri odaklı yaklaşımların etkileri kıyaslanmıştır. Yaygın kullanıma sahip olan YOLOv4 ağı üzerinde yapılan ağ yapısı değişikliğinin başarım ve performansa etkisiyle, veri setinde kullanılan verilerin yeniden hazırlanmasıyla elde edilen başarım karşılaştırılarak yorumlanmıştır. Ağ yapısının değişimi ile nesne tanıma başarısı yaklaşık %4 oranında artarken, hesaplama hızında ortalama %8’lik düşüş meydana gelmiştir. Öte yandan verilerin yeniden hazırlanarak nesne tanıma algoritmasının çalıştırılması %6 oranında kazanç sağlarken, hesaplama maliyetinde değişime neden olmamıştır. Günümüzde yeteri kadar dikkate alınmasa da veri üzerindeki hazırlıkların sınıflandırma doğruluğuna önemli derecede etki yaptığı gözlemlenmiştir.

CNN and Dataset Optimizations to Improve Object Detection Performance with Model and Data-Centric Approaches

To improve the accuracy of object detection and classification methods, model and data-centric approaches have been frequently studied by researchers in recent years. Most researchers propose methods based on their problem or present new methods by changing the existing models. On the other hand, the number of studies on the data used in the training process is quite small. In this study, the effects of model and data-centric approaches on an existing object detection problem are compared. The accuracy and performance effect obtained with YOLOv4 network, which has widespread usage, and reprocessing of the dataset are compared and evaluated. While the accuracy of object detection increased by about 4% with the change in the network structure, an average of 8% decrease occurred in the computational speed. On the other hand, reprocessing the data and running the object detection algorithm provided 6% gain, but did not cause a change in the calculation cost. Although it is not considered enough today, it is observed that the preparations of the data have a significant effect on the classification accuracy.

___

  • A. Kumar, Z. J. Zhang and H. Lyu, “Object detection in real time based on improved single shot multi-box detector algorithm.” EURASIP Journal on Wireless Communications and Networking, vol.1, pp. 1-18, 2020.
  • Y. Cai, T. Luan, H. Gao, H. Wang, L. Chen, Y. Li, M.Á. Sotelo and Z. Li, “YOLOv4-5D: An Effective and Efficient Object Detector for Autonomous Driving.” IEEE Transactions on Instrumentation and Measurement, vol.70, pp.1-13, 2021.
  • Zhai, S., Shang, D., Wang, S., & Dong, S. (2020). DF-SSD: An improved SSD object detection algorithm based on DenseNet and feature fusion. IEEE access, 8, 24344-24357.
  • Northcutt, C. G., Athalye, A., & Mueller, J. (2021). Pervasive label errors in test sets destabilize machine learning benchmarks. arXiv preprint arXiv:2103.14749.
  • Li, K., Ma, W., Sajid, U., Wu, Y., & Wang, G. (2020). Object detection with convolutional neural networks. In Deep Learning in Computer Vision (pp. 41-62). CRC Press.
  • S. Ren, K. He, R. Girshick, J. Sun, "Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks", IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 39, no. 6, pp. 1137-1149, June 2017.
  • J. Redmon, S. Divvala, R. Girshick, A. Farhadi, "You Only Look Once: Unified Real-Time Object Detection", 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 779-788, 2016.
  • W Liu, D Anguelov, D Erhan et al., SSD: Single Shot MultiBox Detector, pp. 21-37, 2015.
  • C Y Fu, W Liu, A Ranga et al., DSSD: Deconvolutional Single Shot Detector, 2017.
  • T Y Lin, P Goyal, R Girshick et al., "Focal Loss for Dense Object Detection", IEEE Transactions on Pattern Analysis & Machine Intelligence, no. 99, pp. 2999-3007, 2017.
  • P. Purkait, C. Zhao and C. Zach, “SPP-Net: Deep absolute pose regression with synthetic views.” arXiv preprint arXiv:1712.03452, 2017.
  • Y. LeCun, Y. Bengio and G. Hinton, “Deep learning. Nature”, vol.521 no.7553, pp.436-444, 2015.
  • Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). Imagenet classification with deep convolutional neural networks. Advances in neural information processing systems, 25, 1097-1105.
  • Shanta, S. S., Anwar, S. T., & Kabir, M. R. (2018, July). Bangla sign language detection using sift and cnn. In 2018 9th international conference on computing, communication and networking technologies (ICCCNT) (pp. 1-6). IEEE.
  • Hung, B. T. (2021). Face recognition using hybrid HOG-CNN approach. In Research in Intelligent and Computing in Engineering (pp. 715-723). Springer, Singapore.
  • Tian, Y., Yang, G., Wang, Z., Wang, H., Li, E., & Liang, Z. (2019). Apple detection during different growth stages in orchards using the improved YOLO-V3 model. Computers and electronics in agriculture, 157, 417-426.
  • Bochkovskiy, Alexey, Chien-Yao Wang, and Hong-Yuan Mark Liao. "YOLOv4: Optimal Speed and Accuracy of Object Detection." arXiv preprint arXiv:2004.10934 (2020).
  • Ultralytics, "YOLOv5". Available: https://github.com/ultralytics/yolov5. [Erişim Tarihi: 02.01.2022]
  • Whang, S. E., Roh, Y., Song, H., & Lee, J. G. (2021). Data Collection and Quality Challenges in Deep Learning: A Data-Centric AI Perspective. arXiv preprint arXiv:2112.06409.
  • A Chat with Andrew on MLOps: From Model-centric to Data-centric AI https://www.youtube.com/watch?v=06-AZXmwHjo&t=69s.
  • Alparslan, Ö., Çetin, Ö. (2021). Comparison of Object Detection and Classification Methods For Mobile Robots. Sakarya University Journal of Science, 25(3), 764-778.
  • YOLOv5 hakkındaki Tartışmaya Yanıt Verme, https://blog.roboflow.com/yolov4-versus-yolov5/.
  • Kuznetsova, A., Rom, H., Alldrin, N., Uijlings, J., Krasin, I., PontTuset, J., et al. (2018). The open images dataset v4: Unified image classification, object detection, and visual relationship detection at scale.
  • Arduengo, Miguel, Carme Torras, and Luis Sentis. "Robust and adaptive door operation with a mobile manipulator robot."arXiv preprint arXiv:1902.09051 (2019).
  • U. Patil et al., "Deep Learning Based Stair Detection and Statistical Image Filtering for Autonomous Stair Climbing," 2019 Third IEEE International Conference on Robotic Computing (IRC), 2019, pp. 159-166, doi: 10.1109/IRC.2019.00031.
Mühendislik Bilimleri ve Araştırmaları Dergisi-Cover
  • ISSN: 2687-4415
  • Yayın Aralığı: Yılda 2 Sayı
  • Başlangıç: 2019
  • Yayıncı: Bandırma Onyedi Eylül Üniversitesi