İkili Kümeleme Yaklaşımıyla Suç Bölgelerinin Tespiti ve İkili Kümeleme Yöntemlerinin Karşılaştırılması

Sosyal yaşamın güvenliği açısından, suç işlenmeden önce, suçların önceden öngörülmesi ve gerekli önlemlerin alınması oldukça önemli bir konudur. Bu amaçla güvenlik birimlerinin gerekli önlemleri alması için suç analizi yapılması gerekmektedir. Bu konuda veri madenciliği yaklaşımı güvenlik birimlerine büyük verilerin analizinde önemli bir katkı sağlamaktadır. Bu kapsamda potansiyel suç bölgelerinin tahmin edilerek belirlenmesinde farklı veri analiz yöntemleri uygulanmaktadır. Suç bölgelerinin tespitinde ikili kümeleme yöntemlerini kullanarak suçun işlendiği bölgeler ile suç türlerini aynı anda kümelemek, geleneksel kümeleme yöntemlerine göre daha kapsamlı sonuçlar sağlamaktadır. Bu çalışmada veri madenciliği yaklaşımı ile suç bölgelerini belirlemek için "Boston'daki Suçlar” veri seti üzerinde CC ve Xmotif algoritmaları kullanılmıştır. Elde edilen ikili kümelerin etkinliğini ölçmek amacıyla algoritmaların performansı Chia ve Karuturi ikili küme skoruna (CKSB) bakılarak karşılaştırılmıştır. Elde edilen sonuçlar R-project 3.5.3 yazılımı kullanılarak sağlanmıştır. Kullanılan bu veri seti için CC algoritmasının Xmotif algoritmasına göre daha iyi sonuçlar verdiği ortaya çıkmıştır.

Detection of Crime Regions with Biclustering Approach and Comparison of Methods

In terms of safety of the social life, it is very important to foresee the crimes and take the necessary precautions before the crime is committed. For this purpose, crime analysis should be carried out in order for security units to take necessary measures. In this regard, the data mining approach makes a significant contribution to the security units in the analysis of large data. In this context, different data analysis methods are used to estimate and identify potential crime areas. By using dual clustering methods in the detection of crime zones, clustering of crime areas and crime types at the same time provides more comprehensive results than traditional clustering methods. In this study, CC and Xmotif algorithms were used on the data set of “Crimes in Boston” to determine the crime sites by using data mining approach. The results were obtained by using R-project 3.5.3 software. It was found that CC algorithm gives better results for this data set than Xmotif algorithm.

___

[1] B. Altunkaynak, H. H. Örkcü and A. Ramazan, “Şehirlerin suç türlerine göre ikili kümeleme yöntemi ile gruplandırılması: Türkiye örneği”Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, vol. 22, pp. 110–120, Apr. 2018.

[2] Orakcı, M., Ciylan, B., Kök, İ. and Sevri, M., “Suç Analizinde Veri Madenciliği Teknikleri Ve Makine Öğrenmesi Algoritmalarının Kullanılması”, 2019 [Online] Available:https://ab.org.tr/ab16/bildiri/111.pdf, Accessed:22-May-2019 .

[3] I. Cil, "Consumption universes based supermarket layout through association rule mining and multidimensional scaling". Expert Systems with Application 39.10, 8611-8625. 2012.

[4] M.F. Adak, C. Sen, I. Cil, "İçme Suyu Parametrelerinin Ölçülen Değerleri Üzerine Veri Madenciliği Uygulayarak Parametreler Arası İlişkiyi Belirlemek". Akademik Platform Mühendislik ve Fen Bilimleri Dergisi 1, 18-25. 2013

[5] I. Cil, D. Ay, Y.S. Turkan, “Data driven decision support to supermarket layout”, In Proceeding AIKED’09 Proceedings of the 8th WSEAS International Conference on Artificial Intelligence, Knowledge Engineering and Data Bases 2009 Feb 21.

[6] D. Bozdağ, A. S. Kumar and U.V. Catalyurek. "Comparative analysis of biclustering algorithms." In Proceedings of the First ACM International Conference on Bioinformatics and Computational Biology, pp. 265-274. ACM, 2010.

[7] İ. Çil, "Bilgi Tabanlı İmalat Karar Destek Sistemleri ve Bir Uygulama." Endüstri Mühendisliği.1.1, 15-27. 2002

[8] B. Pontes, R. Giraldez and J.S. Aguilar-Ruiz, “Biclustering on expression data: A review”, Journal of Biomedical Informatics, vol.57, pp.163–180, Jul.2015.

[9] X. Zhu, J. Qui, M. Xie and J. Wang, “A multi-objective biclustering algorithm based on fuzzy mathematics”, Neurocomputing, vol.253, pp.177–182, Mar. 2017.

[10] R. Arslan, H.H. Örkcü and B. Altunkaynak, “Kaçakçılıkta yakalanan malzeme türlerine göre suçluların kümelenmesi: İkili kümeleme yöntemi”, Uluslararası İktisadi ve İdari İncelemeler Dergisi, 18. EYİ Özel Sayısı, pp.883-896, Jan. 2018.

[11] A. Kocatürk, “İkili kümeleme algoritmalarının görsel ve sayısal açıdan karşılaştırılması”, Gazi Üniversitesi, Ankara, 2018.

[12] M. Singh, M. Mehrotra, “Impact of biclustering on the performance of biclustering based collaborative filtering”, Expert Systems With Applications, vol. 113, pp.443–456, Jun. 2018.

[13] J. G. Dominguez, R. R. Exposito, “Accelerating binary biclustering on platforms with CUDAenabled GPUs”, Information Sciences, vol. 000, pp.1–9, May. 2018.

[14] Q. Gu, K. Veselkov, “Bi-clustering of metabolic data using matrix factorization tools”, Methods, vol.151, pp.12–20, Feb. 2018.

[15] A. Kocatürk, B. Altunkaynak, “Gen açıklama verileri için ikili kümeleme algoritmalarının karşılaştırılması ve uygulanması”, Türkiye Klinikleri J Biostat, vol.10, pp.137-52, Sep.2018.

[16] R. Subhanishi, V. Milani, “Implementing geographical information system to provide evident support for crime analysis”, Procedia Computer Science, vol.48, pp.537 – 540, May. 2015.

[17] M. A. Jalil, C. P. Ling, N. M. M. Noor and F. Mohd, “Knowledge representation model for crime analysis”, Procedia Computer Science, vol.116, pp.484–491, Oct. 2017.

[18] P. E. Oguntunde, O. O. Ojo, H. I. Okagbue and O. A. Oguntunde, “Analysis of selected crime data in Nigeria”, Data in Brief, vol.19, pp.1242–1249, Jun.2018.

[19] L. G. A. Alves, H. V. Riberio and F. A. Rodrigues, “Crime prediction through urban metrics and statistical learning”, Physica, vol.505, pp.435–443, Apr.2018.

[20] M. Quick, G. Li and I. B. Smith, “Crime-general and crime-specific spatial patterns: A multivariate spatial analysis of four crime types at the small-area scale”, Journal of Criminal Justice, vol. 58, pp.22–32, Jul. 2018.

[21] “Veri setinin hazırlanması ve düzenlenmesi”, [Online] Available: https://acikders.ankara.edu.tr/pluginfile.php/1375/mod_resource/content/2/B2_Veri%20Seti.pd f, Accessed: 22-May-2019.

[22] S. H. Bal, F. Budak, “Mikroarray Teknolojisi”, Uludağ Üniversitesi Tıp Fakültesi Dergisi, vol.38, pp.227-233, Oct.2012.

[23] Y. Cheng, G. M. Church, “Biclustering of expression data”, In Proceedings of the 8th International Conference on Intelligent Systems for Molecular Biology, vol.8, pp.93–103. 2000,

[24] T. M. Muralı, K. Simon, “Extracting conserved gene expression motifs from gene expression data”, Pacific Symposium on Biocomptuing, vol.8, pp.77-88, 2003.

[25] B. K. H. Chia, R. K. M. Karuturi, R., “Differential co-expression framework to quantify goodness of biclusters and compare biclustering algorithms”, Algorithms for Molecular Biology, vol.5, pp.23, May. 2010.