Transferencia de aprendizaje en redes neuronales convolucionales para espacios embebidos de imágenes

Cargando...
Miniatura

Fecha

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Industrial de Santander

Resumen

El proceso de entrenamiento de las redes neuronales convolucionales (CNNs) genera un gran conjunto de rasgos que caracterizan los datos de entrada. Estas características se utilizan normalmente para fines de discriminación, sin embargo, también se pueden entender como descriptores de datos. En este trabajo se estudia la repercusión de diversos parámetros meta-modelo (arquitectura, del conjunto de entrenamiento, de ajuste) tienen sobre los descriptores para los fines de representatividad. Utilizando el conjunto de datos CIFAR-100 construimos un vector embebido en el espacio alrededor de sus 100 clases de imágenes. A continuación, se evalúa la capacidad descriptiva de cada espacio de la inserción mediante la medición de su desempeño en la búsqueda no supervisada de las 20 súper clases definidas por CIFAR-100. Los resultados muestran que el aprendizaje de transferencia es generalmente más ventajoso para generar imágenes embebidas semánticamente útiles, aunque la formación de una CNN desde cero podría producir resultados similares. Por otra parte, nuestra incorporación semántica revela discrepancias entre CIFAR composición superclase y clases relacionadas visualmente. (como los chimpancés ser visualmente más similar a las personas que a otros omnívoros), esto muestra que sin importar como se compone las superclases, estos descriptores se agrupan por sus semejanzas visuales de la misma forma en que lo hace un ser humano, queda por explorar el impacto de utilizar arquitecturas de redes neuronales convolucionales con fines descriptivos mas que discriminativos que es el fin que cumplen actualmente.

Descripción

Citación