Derin öğrenme ağları, görüntü sınıflandırma uygulamaları için önemli bir araç haline gelmiştir. Görüntülerdeki bozulmalar, sınıflandırıcının performansının önemli ölçüde düşmesine neden olabilir. Bu makalede, bozuk girişler altında VGG16 ağının ikili sınıflandırma performansı için karşılaştırmalı bir araştırma sunulmuştur. Bu amaçla, çeşitli seviyelerde bozulmuş görüntüler ve Gauss gürültüsü, Tuz ve Biber gürültüsü ve bulanıklık efekti ile sabit seviyelerde görüntüler test için kullanılmıştır. VGG16'nın evrişimli katmanları, son üç evrişimli katman ve sınıflandırma için yoğun bir katman hariç dondurulmuştur. Deneysel sonuçlara göre, bozulmanın etkisi arttıkça, derin öğrenme sınıflandırıcısının performansı önemli ölçüde düşmektedir. Bozulma etkilerini içeren artırılmış eğitim durumunda, sonuçlar önemli ölçüde iyileştirilmiştir.
Deep learning networks has become an important tool for image classification applications. Distortions on images may cause the performance of a classifier to decrease significantly. In the present paper, a comparative investigation for binary classification performance of VGG16 network under corrupted inputs has been presented. For this purpose, images corrupted at various levels and fixed levels with Gaussian noise, Salt and Pepper noise and blur effect were used for testing. Convolutional layers of the VGG16 were frozen except the last three convolutional layers and a dense layer for binary classification was added. According to experimental results, as the effect of distortion is increased, performance of the deep learning classifier drops significantly. In the case of augmented training with distortion effects, the results were improved significantly.
deep neural network VGG16 pretrained networks fine tuning augmentation corrupted images
Birincil Dil | İngilizce |
---|---|
Konular | Yapay Zeka |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 30 Aralık 2020 |
Gönderilme Tarihi | 22 Nisan 2020 |
Kabul Tarihi | 2 Aralık 2020 |
Yayımlandığı Sayı | Yıl 2020Cilt: 3 Sayı: 3 |
The papers in this journal are licensed under a Creative Commons Attribution-NonCommercial 4.0 International License