Diseño de un algoritmo computacional basado en aprendizaje profundo para la optimización de un sistema óptico de adquisición de imágenes que preservan la privacidad para la estimación de acciones en entornos clínicos
dc.contributor.advisor | Argüello Fuentes, Henry | |
dc.contributor.advisor | Rueda Chacón, Hoover Fabián | |
dc.contributor.author | Morales Norato, David Santiago | |
dc.contributor.evaluator | Meza Narváez, Pablo Francisco | |
dc.contributor.evaluator | Meneses Fonseca, Jaime Enrique | |
dc.date.accessioned | 2025-05-26T15:42:02Z | |
dc.date.available | 2025-05-26T15:42:02Z | |
dc.date.created | 2025-05-21 | |
dc.date.issued | 2025-05-21 | |
dc.description.abstract | La preservación de la privacidad en sistemas de visión por computadora es esencial, especialmente en aplicaciones médicas donde se manejan datos sensibles de los pacientes. Las soluciones actuales, como sistemas óptico-computacionales que distorsionan las imágenes desde su adquisición, presentan limitaciones en el balance entre preservación efectiva de la privacidad y el desempeño en estimación de acciones. Este trabajo propone un algoritmo para optimizar un sistema óptico mediante la combinación de técnicas multimodales y parametrizaciones avanzadas de elementos ópticos difractivos (EODs), regularizados por métricas como el número de condición y la función de transferencia de modulación (MTF). Las funciones de regularización junto a las parametrizaciones de EODs propuestas promueven distorsiones del campo óptico más fuertes que las superficies tradicionales basadas en polinomios de Zernike, incrementando la privacidad visual. Además, la integración de datos visuales y textuales mediante un esquema multimodal mejora el rendimiento en la estimación de acciones y permite realizar estimaciones en escenarios con datos limitados mediante la técnica "Zero-shot". El método fue evaluado utilizando conjuntos de datos de estimación de acciones en entornos clínicos, analizando tanto su rendimiento en estimación de acciones como sus propiedades ópticas mediante métricas como la resolución, la MTF y el número de condición, demostrando su eficacia en aplicaciones clínicas. | |
dc.description.abstractenglish | Privacy-preserving computer vision systems are essential, especially in medical applications where sensitive patient data is processed. Current methods involve Zernike-based optical-computational systems that distort the optical field before image acquisition; however, they face challenges in effectively preserving privacy while ensuring action recognition performance. This work proposes an algorithm to optimize an optical system through multimodal techniques and advanced parametrizations of diffractive optical elements (DOE), regularized by the condition number of the convolution matrix generated by the point spread function (PSF) and the modulation transfer function (MTF). The proposed regularization functions ensure stronger distortions than traditional Zernike-based continuous surfaces, enhancing visual privacy. Additionally, the multimodal scheme integrates visual and text information, improving action recognition performance and enabling estimations in data-limited scenarios through zero-shot learning. The proposed method was evaluated using multiple action recognition datasets, including those from clinical environments, to assess performance and optical properties. The evaluation included metrics such as resolution, MTF, and condition number, demonstrating that the optimized optical system successfully balances privacy and recognition performance. This approach offers a reliable framework for developing secure and efficient computer vision systems in clinical applications, ensuring that sensitive data remains protected without compromising functionality. | |
dc.description.degreelevel | Maestría | |
dc.description.degreename | Magíster en Matemática Aplicada | |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad Industrial de Santander | |
dc.identifier.reponame | Universidad Industrial de Santander | |
dc.identifier.repourl | https://noesis.uis.edu.co | |
dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/45657 | |
dc.language.iso | spa | |
dc.publisher | Universidad Industrial de Santander | |
dc.publisher.faculty | Facultad de Ciencias | |
dc.publisher.program | Maestría en Matemática Aplicada | |
dc.publisher.school | Escuela de Física | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.license | Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO) | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Elementos ópticos difractivos | |
dc.subject | Privacidad | |
dc.subject | Reconocimiento de acciones | |
dc.subject | Preservación de la privacidad visual | |
dc.subject | Aprendizaje multimodal | |
dc.subject.keyword | Diffractive Optical Elements | |
dc.subject.keyword | Privacy-Preserving Action Recognition | |
dc.subject.keyword | Multimodal Learning | |
dc.title | Diseño de un algoritmo computacional basado en aprendizaje profundo para la optimización de un sistema óptico de adquisición de imágenes que preservan la privacidad para la estimación de acciones en entornos clínicos | |
dc.title.english | End-to-End Design of Diffractive Optical Elements for Privacy-Preserving Action Recognition Systems in Clinical Environments | |
dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
dc.type.hasversion | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Maestría |
Files
Original bundle
1 - 3 of 3
No Thumbnail Available
- Name:
- Nota de proyecto.pdf
- Size:
- 667.24 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Carta de autorización.pdf
- Size:
- 86.06 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 2.18 KB
- Format:
- Item-specific license agreed to upon submission
- Description: