Detection of Crime Regions with Biclustering Approach and Comparison of Methods
Year 2019,
, 145 - 157, 31.12.2019
İbrahim Çil
,
Sümeyye Gizem Çakar
,
Nazan Sarı
Olcay Eydemir
Abstract
In terms of safety
of the social life, it is very important to foresee the crimes and take the
necessary precautions before the crime is committed. For this purpose, crime
analysis should be carried out in order for security units to take necessary
measures. In this regard, the data mining approach makes a significant
contribution to the security units in the analysis of large data. In this
context, different data analysis methods are used to estimate and identify
potential crime areas. By using dual clustering methods in the detection of crime
zones, clustering of crime areas and crime types at the same time provides more
comprehensive results than traditional clustering methods. In this study, CC
and Xmotif algorithms were used on the data set of “Crimes in Boston” to
determine the crime sites by using data mining approach. The results were
obtained by using R-project 3.5.3 software. It was found that CC algorithm
gives better results for this data set than Xmotif algorithm.
References
- [1] B. Altunkaynak, H. H. Örkcü and A. Ramazan, “Şehirlerin suç türlerine göre ikili kümeleme yöntemi ile gruplandırılması: Türkiye örneği”Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, vol. 22, pp. 110–120, Apr. 2018.
- [2] Orakcı, M., Ciylan, B., Kök, İ. and Sevri, M., “Suç Analizinde Veri Madenciliği Teknikleri Ve Makine Öğrenmesi Algoritmalarının Kullanılması”, 2019 [Online] Available:https://ab.org.tr/ab16/bildiri/111.pdf, Accessed:22-May-2019.
- [3] I. Cil, "Consumption universes based supermarket layout through association rule mining and multidimensional scaling". Expert Systems with Application 39.10, 8611-8625. 2012.
- [4] M.F. Adak, C. Sen, I. Cil, "İçme Suyu Parametrelerinin Ölçülen Değerleri Üzerine Veri Madenciliği Uygulayarak Parametreler Arası İlişkiyi Belirlemek". Akademik Platform Mühendislik ve Fen Bilimleri Dergisi 1, 18-25, 2013.
- [5] I. Cil, D. Ay, Y.S. Turkan, “Data driven decision support to supermarket layout”, In Proceeding AIKED’09 Proceedings of the 8th WSEAS International Conference on Artificial Intelligence, Knowledge Engineering and Data Bases 2009 Feb 21.
- [6] D. Bozdağ, A. S. Kumar and U.V. Catalyurek. "Comparative analysis of biclustering algorithms." In Proceedings of the First ACM International Conference on Bioinformatics and Computational Biology, pp. 265-274. ACM, 2010.
- [7] İ. Çil, "Bilgi Tabanlı İmalat Karar Destek Sistemleri ve Bir Uygulama." Endüstri Mühendisliği.1.1, 15-27, 2002.
- [8] B. Pontes, R. Giraldez and J.S. Aguilar-Ruiz, “Biclustering on expression data: A review”, Journal of Biomedical Informatics, vol.57, pp.163–180, Jul.2015.
- [9] X. Zhu, J. Qui, M. Xie and J. Wang, “A multi-objective biclustering algorithm based on fuzzy mathematics”, Neurocomputing, vol.253, pp.177–182, Mar. 2017.
- [10] R. Arslan, H.H. Örkcü and B. Altunkaynak, “Kaçakçılıkta yakalanan malzeme türlerine göre suçluların kümelenmesi: İkili kümeleme yöntemi”, Uluslararası İktisadi ve İdari İncelemeler Dergisi, 18. EYİ Özel Sayısı, pp.883-896, Jan. 2018.
- [11] A. Kocatürk, “İkili kümeleme algoritmalarının görsel ve sayısal açıdan karşılaştırılması”, Gazi Üniversitesi, Ankara, 2018.
- [12] M. Singh, M. Mehrotra, “Impact of biclustering on the performance of biclustering based collaborative filtering”, Expert Systems With Applications, vol. 113, pp.443–456, Jun. 2018.
- [13] J. G. Dominguez, R. R. Exposito, “Accelerating binary biclustering on platforms with CUDA-enabled GPUs”, Information Sciences, vol. 000, pp.1–9, May. 2018.
- [14] Q. Gu, K. Veselkov, “Bi-clustering of metabolic data using matrix factorization tools”, Methods, vol.151, pp.12–20, Feb. 2018.
- [15] A. Kocatürk, B. Altunkaynak, “Gen açıklama verileri için ikili kümeleme algoritmalarının karşılaştırılması ve uygulanması”, Türkiye Klinikleri J Biostat, vol.10, pp.137-52, Sep.2018.
- [16] R. Subhanishi, V. Milani, “Implementing geographical information system to provide evident support for crime analysis”, Procedia Computer Science, vol.48, pp.537 – 540, May. 2015.
- [17] M. A. Jalil, C. P. Ling, N. M. M. Noor and F. Mohd, “Knowledge representation model for crime analysis”, Procedia Computer Science, vol.116, pp.484–491, Oct. 2017.
- [18] P. E. Oguntunde, O. O. Ojo, H. I. Okagbue and O. A. Oguntunde, “Analysis of selected crime data in Nigeria”, Data in Brief, vol.19, pp.1242–1249, Jun.2018.
- [19] L. G. A. Alves, H. V. Riberio and F. A. Rodrigues, “Crime prediction through urban metrics and statistical learning”, Physica, vol.505, pp.435–443, Apr.2018.
- [20] M. Quick, G. Li and I. B. Smith, “Crime-general and crime-specific spatial patterns: A multivariate spatial analysis of four crime types at the small-area scale”, Journal of Criminal Justice, vol. 58, pp.22–32, Jul. 2018.
- [21] “Veri setinin hazırlanması ve düzenlenmesi”, [Online] Available: https://acikders.ankara.edu.tr/pluginfile.php/1375/mod_resource/content/2/B2_Veri%20Seti.pdf, Accessed: 22-May-2019.
- [22] S. H. Bal, F. Budak, “Mikroarray Teknolojisi”, Uludağ Üniversitesi Tıp Fakültesi Dergisi, vol.38, pp.227-233, Oct.2012.
- [23] Y. Cheng, G. M. Church, “Biclustering of expression data”, In Proceedings of the 8th International Conference on Intelligent Systems for Molecular Biology, vol.8, pp.93–103. 2000,
- [24] T. M. Muralı, K. Simon, “Extracting conserved gene expression motifs from gene expression data”, Pacific Symposium on Biocomptuing, vol.8, pp.77-88, 2003.
- [25] B. K. H. Chia, R. K. M. Karuturi, R., “Differential co-expression framework to quantify goodness of biclusters and compare biclustering algorithms”, Algorithms for Molecular Biology, vol.5, pp.23, May. 2010.
İkili Kümeleme Yaklaşımıyla Suç Bölgelerinin Tespiti ve İkili Kümeleme Yöntemlerinin Karşılaştırılması
Year 2019,
, 145 - 157, 31.12.2019
İbrahim Çil
,
Sümeyye Gizem Çakar
,
Nazan Sarı
Olcay Eydemir
Abstract
Sosyal yaşamın güvenliği açısından, suç
işlenmeden önce, suçların önceden öngörülmesi ve gerekli önlemlerin alınması
oldukça önemli bir konudur. Bu amaçla güvenlik birimlerinin gerekli önlemleri
alması için suç analizi yapılması gerekmektedir. Bu konuda veri madenciliği
yaklaşımı güvenlik birimlerine büyük verilerin analizinde önemli bir katkı
sağlamaktadır. Bu kapsamda potansiyel suç bölgelerinin tahmin edilerek
belirlenmesinde farklı veri analiz yöntemleri uygulanmaktadır. Suç bölgelerinin tespitinde ikili kümeleme
yöntemlerini kullanarak suçun işlendiği bölgeler ile suç türlerini aynı anda
kümelemek, geleneksel kümeleme yöntemlerine göre daha kapsamlı sonuçlar
sağlamaktadır. Bu çalışmada veri
madenciliği yaklaşımı ile suç bölgelerini belirlemek için "Boston'daki Suçlar”
veri seti üzerinde CC ve Xmotif algoritmaları kullanılmıştır. Elde edilen ikili
kümelerin etkinliğini ölçmek amacıyla algoritmaların performansı Chia ve
Karuturi ikili küme skoruna (CKSB) bakılarak karşılaştırılmıştır. Elde edilen sonuçlar R-project 3.5.3 yazılımı
kullanılarak sağlanmıştır. Kullanılan bu veri seti için CC algoritmasının
Xmotif algoritmasına göre daha iyi sonuçlar verdiği ortaya çıkmıştır.
References
- [1] B. Altunkaynak, H. H. Örkcü and A. Ramazan, “Şehirlerin suç türlerine göre ikili kümeleme yöntemi ile gruplandırılması: Türkiye örneği”Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, vol. 22, pp. 110–120, Apr. 2018.
- [2] Orakcı, M., Ciylan, B., Kök, İ. and Sevri, M., “Suç Analizinde Veri Madenciliği Teknikleri Ve Makine Öğrenmesi Algoritmalarının Kullanılması”, 2019 [Online] Available:https://ab.org.tr/ab16/bildiri/111.pdf, Accessed:22-May-2019.
- [3] I. Cil, "Consumption universes based supermarket layout through association rule mining and multidimensional scaling". Expert Systems with Application 39.10, 8611-8625. 2012.
- [4] M.F. Adak, C. Sen, I. Cil, "İçme Suyu Parametrelerinin Ölçülen Değerleri Üzerine Veri Madenciliği Uygulayarak Parametreler Arası İlişkiyi Belirlemek". Akademik Platform Mühendislik ve Fen Bilimleri Dergisi 1, 18-25, 2013.
- [5] I. Cil, D. Ay, Y.S. Turkan, “Data driven decision support to supermarket layout”, In Proceeding AIKED’09 Proceedings of the 8th WSEAS International Conference on Artificial Intelligence, Knowledge Engineering and Data Bases 2009 Feb 21.
- [6] D. Bozdağ, A. S. Kumar and U.V. Catalyurek. "Comparative analysis of biclustering algorithms." In Proceedings of the First ACM International Conference on Bioinformatics and Computational Biology, pp. 265-274. ACM, 2010.
- [7] İ. Çil, "Bilgi Tabanlı İmalat Karar Destek Sistemleri ve Bir Uygulama." Endüstri Mühendisliği.1.1, 15-27, 2002.
- [8] B. Pontes, R. Giraldez and J.S. Aguilar-Ruiz, “Biclustering on expression data: A review”, Journal of Biomedical Informatics, vol.57, pp.163–180, Jul.2015.
- [9] X. Zhu, J. Qui, M. Xie and J. Wang, “A multi-objective biclustering algorithm based on fuzzy mathematics”, Neurocomputing, vol.253, pp.177–182, Mar. 2017.
- [10] R. Arslan, H.H. Örkcü and B. Altunkaynak, “Kaçakçılıkta yakalanan malzeme türlerine göre suçluların kümelenmesi: İkili kümeleme yöntemi”, Uluslararası İktisadi ve İdari İncelemeler Dergisi, 18. EYİ Özel Sayısı, pp.883-896, Jan. 2018.
- [11] A. Kocatürk, “İkili kümeleme algoritmalarının görsel ve sayısal açıdan karşılaştırılması”, Gazi Üniversitesi, Ankara, 2018.
- [12] M. Singh, M. Mehrotra, “Impact of biclustering on the performance of biclustering based collaborative filtering”, Expert Systems With Applications, vol. 113, pp.443–456, Jun. 2018.
- [13] J. G. Dominguez, R. R. Exposito, “Accelerating binary biclustering on platforms with CUDA-enabled GPUs”, Information Sciences, vol. 000, pp.1–9, May. 2018.
- [14] Q. Gu, K. Veselkov, “Bi-clustering of metabolic data using matrix factorization tools”, Methods, vol.151, pp.12–20, Feb. 2018.
- [15] A. Kocatürk, B. Altunkaynak, “Gen açıklama verileri için ikili kümeleme algoritmalarının karşılaştırılması ve uygulanması”, Türkiye Klinikleri J Biostat, vol.10, pp.137-52, Sep.2018.
- [16] R. Subhanishi, V. Milani, “Implementing geographical information system to provide evident support for crime analysis”, Procedia Computer Science, vol.48, pp.537 – 540, May. 2015.
- [17] M. A. Jalil, C. P. Ling, N. M. M. Noor and F. Mohd, “Knowledge representation model for crime analysis”, Procedia Computer Science, vol.116, pp.484–491, Oct. 2017.
- [18] P. E. Oguntunde, O. O. Ojo, H. I. Okagbue and O. A. Oguntunde, “Analysis of selected crime data in Nigeria”, Data in Brief, vol.19, pp.1242–1249, Jun.2018.
- [19] L. G. A. Alves, H. V. Riberio and F. A. Rodrigues, “Crime prediction through urban metrics and statistical learning”, Physica, vol.505, pp.435–443, Apr.2018.
- [20] M. Quick, G. Li and I. B. Smith, “Crime-general and crime-specific spatial patterns: A multivariate spatial analysis of four crime types at the small-area scale”, Journal of Criminal Justice, vol. 58, pp.22–32, Jul. 2018.
- [21] “Veri setinin hazırlanması ve düzenlenmesi”, [Online] Available: https://acikders.ankara.edu.tr/pluginfile.php/1375/mod_resource/content/2/B2_Veri%20Seti.pdf, Accessed: 22-May-2019.
- [22] S. H. Bal, F. Budak, “Mikroarray Teknolojisi”, Uludağ Üniversitesi Tıp Fakültesi Dergisi, vol.38, pp.227-233, Oct.2012.
- [23] Y. Cheng, G. M. Church, “Biclustering of expression data”, In Proceedings of the 8th International Conference on Intelligent Systems for Molecular Biology, vol.8, pp.93–103. 2000,
- [24] T. M. Muralı, K. Simon, “Extracting conserved gene expression motifs from gene expression data”, Pacific Symposium on Biocomptuing, vol.8, pp.77-88, 2003.
- [25] B. K. H. Chia, R. K. M. Karuturi, R., “Differential co-expression framework to quantify goodness of biclusters and compare biclustering algorithms”, Algorithms for Molecular Biology, vol.5, pp.23, May. 2010.