Diseño de un algoritmo computacional basado en aprendizaje profundo para la optimización de un sistema óptico de adquisición de imágenes que preservan la privacidad para la estimación de acciones en entornos clínicos

dc.contributor.advisorArgüello Fuentes, Henry
dc.contributor.advisorRueda Chacón, Hoover Fabián
dc.contributor.authorMorales Norato, David Santiago
dc.contributor.evaluatorMeza Narváez, Pablo Francisco
dc.contributor.evaluatorMeneses Fonseca, Jaime Enrique
dc.date.accessioned2025-05-26T15:42:02Z
dc.date.available2025-05-26T15:42:02Z
dc.date.created2025-05-21
dc.date.issued2025-05-21
dc.description.abstractLa preservación de la privacidad en sistemas de visión por computadora es esencial, especialmente en aplicaciones médicas donde se manejan datos sensibles de los pacientes. Las soluciones actuales, como sistemas óptico-computacionales que distorsionan las imágenes desde su adquisición, presentan limitaciones en el balance entre preservación efectiva de la privacidad y el desempeño en estimación de acciones. Este trabajo propone un algoritmo para optimizar un sistema óptico mediante la combinación de técnicas multimodales y parametrizaciones avanzadas de elementos ópticos difractivos (EODs), regularizados por métricas como el número de condición y la función de transferencia de modulación (MTF). Las funciones de regularización junto a las parametrizaciones de EODs propuestas promueven distorsiones del campo óptico más fuertes que las superficies tradicionales basadas en polinomios de Zernike, incrementando la privacidad visual. Además, la integración de datos visuales y textuales mediante un esquema multimodal mejora el rendimiento en la estimación de acciones y permite realizar estimaciones en escenarios con datos limitados mediante la técnica "Zero-shot". El método fue evaluado utilizando conjuntos de datos de estimación de acciones en entornos clínicos, analizando tanto su rendimiento en estimación de acciones como sus propiedades ópticas mediante métricas como la resolución, la MTF y el número de condición, demostrando su eficacia en aplicaciones clínicas.
dc.description.abstractenglishPrivacy-preserving computer vision systems are essential, especially in medical applications where sensitive patient data is processed. Current methods involve Zernike-based optical-computational systems that distort the optical field before image acquisition; however, they face challenges in effectively preserving privacy while ensuring action recognition performance. This work proposes an algorithm to optimize an optical system through multimodal techniques and advanced parametrizations of diffractive optical elements (DOE), regularized by the condition number of the convolution matrix generated by the point spread function (PSF) and the modulation transfer function (MTF). The proposed regularization functions ensure stronger distortions than traditional Zernike-based continuous surfaces, enhancing visual privacy. Additionally, the multimodal scheme integrates visual and text information, improving action recognition performance and enabling estimations in data-limited scenarios through zero-shot learning. The proposed method was evaluated using multiple action recognition datasets, including those from clinical environments, to assess performance and optical properties. The evaluation included metrics such as resolution, MTF, and condition number, demonstrating that the optimized optical system successfully balances privacy and recognition performance. This approach offers a reliable framework for developing secure and efficient computer vision systems in clinical applications, ensuring that sensitive data remains protected without compromising functionality.
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Matemática Aplicada
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/45657
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ciencias
dc.publisher.programMaestría en Matemática Aplicada
dc.publisher.schoolEscuela de Física
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAtribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectElementos ópticos difractivos
dc.subjectPrivacidad
dc.subjectReconocimiento de acciones
dc.subjectPreservación de la privacidad visual
dc.subjectAprendizaje multimodal
dc.subject.keywordDiffractive Optical Elements
dc.subject.keywordPrivacy-Preserving Action Recognition
dc.subject.keywordMultimodal Learning
dc.titleDiseño de un algoritmo computacional basado en aprendizaje profundo para la optimización de un sistema óptico de adquisición de imágenes que preservan la privacidad para la estimación de acciones en entornos clínicos
dc.title.englishEnd-to-End Design of Diffractive Optical Elements for Privacy-Preserving Action Recognition Systems in Clinical Environments
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Maestría
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
667.24 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
8.62 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
86.06 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.18 KB
Format:
Item-specific license agreed to upon submission
Description: