Estimación de la profundidad a partir de proyecciones 2d del campo de luz mediante aprendizaje profundo

dc.contributor.advisorVargas Díaz, Edwin Mauricio
dc.contributor.advisorArguello Fuentes, Henry
dc.contributor.authorMartínez Estrada, Emmanuel David
dc.date.accessioned2024-03-04T01:17:51Z
dc.date.available2021
dc.date.available2024-03-04T01:17:51Z
dc.date.created2021
dc.date.issued2021
dc.description.abstractEn los últimos años, estimar la profundidad de una escena se ha convertido en unatarea desafiante, debido a que esta información se desvanece al adquirir una única proyección conun sensor bidimensional, generando un problema inverso mal planteado. La profundidad se puedeestimar de manera robusta aprovechando la información espacial y angular que proporcionan loscampos de luz. Sin embargo, adquirir los campos de luz requieren un alto costo de almacenamientoy de procesamiento limitando el uso de esta tecnología en aplicaciones prácticas. Para superar estalimitación, la teoría de muestreo compresivo ha permitido el desarrollo de arquitecturas ópticaspara adquirir una única proyección codificada del campo de luz. Sin embargo, este tipo de técnicasrequieren un alto costo computacional para decodificarla. Este trabajo propone optimizar conjuntamente una arquitectura Óptica para adquirir el campo de luz a partir de una única proyección y unared neuronal convolucional que funciona como decodificador en un enfoque de extremo a extremopara la estimación de la profundidad. Esto permite estimar directamente la profundidad desde lasmedidas comprimidas omitiendo el proceso de reconstrucción del campo de luz que se requiere enenfoques tradicionales. Para el decodificador se propone una red compuesta de bloques residualesy proyecciones ascendentes basada en la arquitectura U-net, que contribuye a la estimación óptimade la profundidad a partir de la escasa información que brindan las medidas comprimidas. Experimentalmente, se encontró que el método propuesto estima mapas de disparidad comparables conlos obtenidos usando campos de luz reconstruidos. Además, el método propuesto es 20 veces másrápido en el entrenamiento y 23 veces más rápido en la inferencia en comparación con el mejormétodo que estima la profundidad a partir de campos de luz reconstruidos.
dc.description.abstractenglishIn the last years, estimating the depth of a scene has become a challenging task,because this information vanishes when acquiring a single projection with a two-dimensional sensor, generating an ill-posed inverse problem. Depth can be robustly estimated leveraging spatialand angular information provided by light fields. However, acquiring the light fields requires ahigh cost of storage and processing, limiting the use of this technology in practical applications.To overcome this limitation, the theory of compressive sensing has allowed the development ofoptical architectures to acquire a single encoded projection of the light field. However, this type oftechnique requires a high computational cost to decode. This work proposes to jointly optimize anoptical architecture to acquire a single light field projection and a convolutional neural network thatfunctions as a decoder in an end-to-end approach for depth estimation. This allows depth to be directly estimated from compressed measurements by omitting the light field reconstruction processrequired in traditional approaches. For the decoder, a network composed of residual blocks andascending projections based on the U-net architecture is proposed, which contributes to the optimal estimation of the depth from the little information provided by the compressed measurements.Experimentally, it was found that the proposed method estimates disparity maps comparable withthose obtained using reconstructed light fields. Furthermore, the proposed method is 20 times faster in training and 23 times faster in inference compared to the best method that estimates depthfrom reconstructed light fields.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero de Sistemas
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/41578
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programIngeniería de Sistemas
dc.publisher.schoolEscuela de Ingeniería de Sistemas e Informática
dc.rightshttp://creativecommons.org/licenses/by/4.0/
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0
dc.subjectEstimación de profundidad
dc.subjectCampo de luz
dc.subjectMuestreo compresivo
dc.subjectRedes neuronales convolucionales
dc.subjectEnfoque de extremo a extremo.
dc.subject.keywordDepth Estimation
dc.subject.keywordLight Field
dc.subject.keywordCompressive Sensing
dc.subject.keywordConvolutional Neural Networks
dc.subject.keywordend-to-end approach.
dc.titleEstimación de la profundidad a partir de proyecciones 2d del campo de luz mediante aprendizaje profundo
dc.title.englishDepth estimation from 2D projections of the light field using deep
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
110.2 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
24.86 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
289.39 KB
Format:
Adobe Portable Document Format