Optimización de un sistema de codificación óptico-computacional mediante regularización estadística basado en un método de aprendizaje profundo

dc.contributor.advisorArgüello Fuentes, Henry
dc.contributor.authorJácome Carrascal, Román Alejandro
dc.contributor.evaluatorAvendaño Franco, Guillermo
dc.contributor.evaluatorFlórez Torres, Manuel Alberto
dc.date.accessioned2024-02-20T21:31:43Z
dc.date.available2024-02-20T21:31:43Z
dc.date.created2024-02-16
dc.date.issued2024-02-16
dc.description.abstractLa codificación óptica es una técnica esencial en la imagen computacional (IC) que permite la detección de señales de alta dimensión a través de proyecciones codificadas post-procesadas para decodificar la señal subyacente. En la actualidad, los elementos de codificación óptica (OCE) se optimizan de extremo a extremo (E2E), donde un conjunto de capas (codificador) de una red neuronal profunda modela el OCE mientras que el resto de la red (decodificador) realiza una tarea computacional determinada. Aunque el rendimiento de entrenamiento de toda la red es aceptable, la capa del codificador óptico pueden ser defectuosas, dando lugar a diseños de OCE deficientes. Este rendimiento defectuoso en el codificador se debe a factores como que la función de pérdida de la red no considera las capas intermedias por separado, ya que se desconoce la salida en esas capas. En segundo lugar, el codificador sufre la desaparición del gradiente, ya que el codificador se define en las primeras capas. En tercer lugar, la estimación adecuada del gradiente en estas capas está restringida a satisfacer limitaciones físicas. En este trabajo, proponemos una optimización de extremo a extremo regularizado la salida intermedia de la red, en la que se utiliza un conjunto de funciones de regularización para superar la optimización defectuosa del codificador óptico. De hecho, nuestra regularización no requiere conocimientos adicionales del codificador y puede aplicarse a la mayoría de los instrumentos de detección óptica en imagen computacional. En consecuencia, la regularización explota algunos conocimientos previos sobre la tarea computacional, las propiedades estadísticas de la salida del codificador (medidades codificadas) y del sistema de adqusición. En concreto, propusimos tres tipos de regularizadores: El primero se basa en las divergencias estadísticas de las medidas comprimidas, el segundo depende sólo de la varianza de las medidas, y el último es un regularizador estructural que promueve el bajo rango y escacez del conjunto de medidas. Hemos validado el procedimiento de entrenamiento propuesto en dos sistemas de imagen computacional representativos, la cámara de píxel único (SPC) y el sistema de única cáptura de imágenes espectrales con aperturas codificadas (CASSI), mostrando una mejora significativa con respecto a los diseños no regularizados. Además, la regularización propuesta se empleó para tareas de visión por computador de alto nivel en modelos generativos mostrando su eficacia también en esta nueva aplicación.
dc.description.abstractenglishOptical coding is an essential technique in computational imaging (CI) that allows high-dimensional signal sensing through post-processed coded projections to decode the underlying signal. Currently, the optical coding elements (OCE) are optimized in an end-to-end (E2E) manner where a set of layers (encoder) of a deep neural network model the OCE while the rest of the network (decoder) performs a given computational task. Although the training performance of the whole network is acceptable, the encoder layers can be flawed, leading to deficient OCE designs. This flawed performance in the encoder arises from factors such as the network's loss function does not consider the intermedium layers separately as the output at those layers is unknown. Second, the encoder suffers from the vanishing of the gradient since the encoder is defined in the first layers. Third, the proper estimation of the gradient in these layers is constrained to satisfy physical limitations. In this work, we propose a middle output regularized end-to-end optimization, where a set of regularization functions are used to overcome the flawed optimization of the encoder. In fact, our regularization does not require additional knowledge from the encoder and can be applied to most optical sensing instruments in computational imaging. Accordingly, the regularization exploits some prior knowledge about the computational task, the statistical properties of the output of the encoder (measurements), and the sensing model. Specifically, we proposed three types of regularizers: The first one is based on statistical divergences of the measurements, the second depends only on the variance of the measurements, and the last one is a structural regularizer promoting low rankness and sparsity of the set of measurements. We validated the proposed training procedure in two representative computational imaging systems, the single-pixel camera (SPC), and the coded aperture snapshot spectral imager (CASSI), showing significant improvement with respect to non-regularized designs. Moreover, the proposed regularization was employed for high-level computer vision tasks in generative models showing its efficiency also in this new application.
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Matemática Aplicada
dc.description.googlescholarhttps://scholar.google.com/citations?user=n3cPHTMAAAAJ&hl=en
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/15746
dc.language.isoeng
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ciencias
dc.publisher.programMaestría en Matemática Aplicada
dc.publisher.schoolEscuela de Física
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAtribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectImágenes computacionales
dc.subjectOptimización de extremo a extremo
dc.subjectProblemas inversos
dc.subjectOptimización regularizada
dc.subject.keywordComputational Imaging
dc.subject.keywordEnd-to-End Optimization
dc.subject.keywordInverse Problems
dc.subject.keywordRegularized Optimization
dc.titleOptimización de un sistema de codificación óptico-computacional mediante regularización estadística basado en un método de aprendizaje profundo
dc.title.englishOptimization of a Computational Imaging System by Statistical Regularization Based on a Deep Learning Method
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Maestría
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
385.07 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
134.2 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
44.51 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.18 KB
Format:
Item-specific license agreed to upon submission
Description: