Destilado de bases de datos de imágenes hiperespectrales basado en aprendizaje profundo para la solución de problemas de clasificación

dc.contributor.advisorArguello Fuentes, Henry
dc.contributor.advisorJácome Carrascal, Román Alejandro
dc.contributor.authorGutiérrez Palomino, Edinsson
dc.contributor.evaluatorCorrea Pugliese, Claudia Victoria
dc.contributor.evaluatorBacca Quintero, Jorge Luis
dc.date.accessioned2024-08-29T12:39:39Z
dc.date.available2024-08-29T12:39:39Z
dc.date.created2024-08-28
dc.date.issued2024-08-28
dc.description.abstractEl destilado (o condensación) de bases de datos es una técnica utilizada para reducir la dimensionalidad de los conjuntos de datos empleados en el entrenamiento de modelos de aprendizaje profundo, que, según Yu et al. (2024), fue inicialmente propuesta por Wang et al. (2020); pero que sin embargo, a dı́a de hoy aún tiene limitaciones para su aplicación en datos de alta dimensionalidad (Lei and Tao, 2024) en los cuales se incluyen las imágenes hiper- espectrales, un tipo de señal que se caracteriza (entre otras cosas) por proveer información a lo largo de una enorme gama de frecuencias del espectro electromagnético a una escala mayor que la de las imágenes multiespectrales, lo que la convierte en la señal de tipo imagen con mayor dimensionalidad; pero que a pesar de ello es ampliamente utilizada para resolver diversos problemas de clasificación de (entre otras cosas) materiales, tipos de suelo, sustancias y enfermedades, a menudo por medio de clasificadores basados en aprendizaje profundo, los cuales también son co- nocidos por su alto costo de entrenamiento debido a la enorme cantidad de parámetros optimizables que poseen, lo que dificulta aún mas la tarea de entrenamiento y clasificación en proyectos con capacidades de cómputo limitadas. Es debido a lo anterior que este trabajo investigativo presenta la implementación de un algoritmo de destilado basado en el aprendizaje profundo aplicado a imágenes hiperespectrales. Referencias: Yu, R., Liu, S., and Wang, X. (2024). Dataset distillation: A comprehensive review. IEEE Transac- tions on Pattern Analysis and Machine Intelligence, 46(1):150–170. Wang, T., Zhu, J.-Y., Torralba, A., and Efros, A. A. (2020). Dataset distillation. Lei, S. and Tao, D. (2024). A comprehensive survey of dataset distillation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 46(1):17–32.
dc.description.abstractenglishDataset distillation (also known as dataset condensation) is a dimensionality reduction technique for training datasets of deep learning models, first proposed by Wang et al. (2020), according to Yu et al. (2024). This technique presents some limitations when applied to high-dimensional data (Lei and Tao, 2024), these include hypers- pectral images, a type of signal that provides information across a wider range of frequencies in the electromagnetic spectrum compared to multispectral images, making them the type of image with the greatest dimensionality. Despi- te this, they are widely used to solve classification problems of materials, soil types, substances, and diseases, often using deep learning models. These models are known for consuming significant computational resources due to their high number of parameters to optimize, making the classification task harder for projects with limited computational resources. To this end, this research implements an algorithm for hyperspectral image classification dataset distillation based on deep learning. References: Yu, R., Liu, S., and Wang, X. (2024). Dataset distillation: A comprehensive review. IEEE Transac- tions on Pattern Analysis and Machine Intelligence, 46(1):150–170. Wang, T., Zhu, J.-Y., Torralba, A., and Efros, A. A. (2020). Dataset distillation. Lei, S. and Tao, D. (2024). A comprehensive survey of dataset distillation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 46(1):17–32.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero de Sistemas
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/43963
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingeníerias Fisicomecánicas
dc.publisher.programIngeniería de Sistemas
dc.publisher.schoolEscuela de Ingeniería de Sistemas e Informática
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAtribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectDestilación de base de datos
dc.subjectImágenes hiperespectrales
dc.subjectClasificación
dc.subjectAprendizaje profundo
dc.subject.keywordDataset distillation
dc.subject.keywordhyperspectral image
dc.subject.keywordclassification
dc.subject.keywordDeep learning
dc.titleDestilado de bases de datos de imágenes hiperespectrales basado en aprendizaje profundo para la solución de problemas de clasificación
dc.title.englishDataset distillation for hyperspectral images based on deep learning to solve classification problems
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Documento.pdf
Size:
3.69 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
437.91 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
47.77 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.18 KB
Format:
Item-specific license agreed to upon submission
Description: