Makine Öğrenmesi ile Ürün Kategorisi Sınıflandırma
Öz
Teknolojinin ilerlemesi ve internetin gelişmesi ile beraber günümüzde bilginin gücü de ön plana çıkmıştır. Bununla beraber internet dünyasında bilgi kirliliği ve karmaşası ortaya çıkmaya başlamıştır. Bu karmaşadan anlamlı verilerin çıkartılması ve yorumlanabilmesi için makine öğrenmesi algoritmalarından yararlanılabilir. Bu çalışmada yazı formunda girilen açıklamanın kategori bilgisine ulaşılması amaçlanmıştır. Bir e-ticaret sitesinden ürün bilgileri etiketlenerek veri seti elde edilmiştir. Toplanan bu veri seti makine öğrenmesi algoritmalarıyla model eğitimi gerçekleştirilmiş ve 9 farklı katagoriye ayırmak için doğru tahminleme yapması amaçlanmıştır. Bu eğitim sırasında Random Forest, Karar Ağacı, Multinominal Naive Bayes (Multinominal NB), Logistic Regression, Destek Vektör Makineleri (DVM) ve Yapay Sinir Ağları (YSA) sınıflandırıcıları kullanılmış ve çıkan sonuçlar tablolarla karşılaştırılmıştır.
Anahtar Kelimeler
References
- [1] A. H. Aliwy ve E. H. Abdul Ameer, “Comparative Study of Five Text Classification Algorithms with their Improvements”, International Journal of Applied Engineering Research, 2017.
- [2] H. Alshalabi, S. Tiun, N. Omar, M. Albared, “Experiments on the Use of Feature Selection and Machine Learning Methods in Automatic Malay Text Categorization”, Science Direct, Procedia Technology, Elsevier, 2013.
- [3] I. Hmeidi, M. Al-Ayyoub, N. A. Abdulla, A. A. Almodawar, R. Abooraig, N. A. Mahyoub, “Automatic Arabic Text Categorisation: A Comprehensive Comparative Study”, Journal of Information Science, 2015. [4] C. C. Aggarwal ve C. X. Zhai, “A Survey Of Text Classification Algorithms”, Mining Text Data, Chapter 6, 2012.
- [5] H. Deng, Y. Sun, Y. Chang, J. Han, “Probabilistic Models for Classification” C.C. Aggarwal (Eds.), Data Classification Algorithms and Applications (pp. 67-70), CRC Press, New York, USA, 2015.
- [6] J. D. Rennie, L. Shih, J. Teevan, D. Karger, “Tackling the poor assumptions of naive bayes text classifiers” Proceedings of the Twentieth International Conference on Machine Learning (ICML-2003), Washington DC, 2003.
- [7] D. G. Kleinbaum, ve M. Klein, “Logistic Regression: A Self-Learning Text (Statistics for Biology and Health)”, Third Edition. New York: Springer 2010.
- [8] G. Louppe, “Understanding Random Forest”, doktora tezi, University of Liege, 2015.
- [9] S. C. Albright, W. L. Winston, ve C. Zappe, “Data Analysis & Decision Making”, Üçüncü Baskı, Australia: Thomson South-Western, 2006.
Details
Primary Language
Turkish
Subjects
-
Journal Section
Research Article
Publication Date
April 30, 2019
Submission Date
February 6, 2019
Acceptance Date
April 24, 2019
Published in Issue
Year 1970 Volume: 2 Number: 1
Cited By
İş Memnuniyeti Faktörlerini Belirlemek ve Analiz Etmek için Çevrimiçi Çalışan Değerlendirmelerini Kullanan ilgili Makine Öğrenmesi ve Topluluk Öğrenmesi Tabanlı Yöntem
European Journal of Science and Technology
https://doi.org/10.31590/ejosat.1173627Using Multi-Label Classification Methods to Analyze Complaints Against Cargo Services During the COVID-19 Outbreak: Comparing Survey-Based and Word-Based Labeling
Sakarya University Journal of Computer and Information Sciences
https://doi.org/10.35377/saucis...1121830Prediction of Home Loan Approval with Machine Learning
Advances in Artificial Intelligence Research
https://doi.org/10.54569/aair.1585994Price prediction of dual-listed stocks with RF and LSTM algorithms: NYSE and BIST comparison
Mathematical Modelling and Numerical Simulation with Applications
https://doi.org/10.53391/mmnsa.1577228Evaluation of Machine Learning and Ensemble Learning Models for Classification Using Delivery Data
Verimlilik Dergisi
https://doi.org/10.51551/verimlilik.1526436Automatic Classification of Banking Branch Requests and Errors with Natural Language Processing and Machine Learning
International Journal of Engineering and Innovative Research
https://doi.org/10.47933/ijeir.1597039
