Diseño de un algoritmo computacional basado en aprendizaje profundo para la optimización de un sistema óptico de adquisición de imágenes que preservan la privacidad para la estimación de acciones en entornos clínicos

Abstract
La preservación de la privacidad en sistemas de visión por computadora es esencial, especialmente en aplicaciones médicas donde se manejan datos sensibles de los pacientes. Las soluciones actuales, como sistemas óptico-computacionales que distorsionan las imágenes desde su adquisición, presentan limitaciones en el balance entre preservación efectiva de la privacidad y el desempeño en estimación de acciones. Este trabajo propone un algoritmo para optimizar un sistema óptico mediante la combinación de técnicas multimodales y parametrizaciones avanzadas de elementos ópticos difractivos (EODs), regularizados por métricas como el número de condición y la función de transferencia de modulación (MTF). Las funciones de regularización junto a las parametrizaciones de EODs propuestas promueven distorsiones del campo óptico más fuertes que las superficies tradicionales basadas en polinomios de Zernike, incrementando la privacidad visual. Además, la integración de datos visuales y textuales mediante un esquema multimodal mejora el rendimiento en la estimación de acciones y permite realizar estimaciones en escenarios con datos limitados mediante la técnica "Zero-shot". El método fue evaluado utilizando conjuntos de datos de estimación de acciones en entornos clínicos, analizando tanto su rendimiento en estimación de acciones como sus propiedades ópticas mediante métricas como la resolución, la MTF y el número de condición, demostrando su eficacia en aplicaciones clínicas.
Description
Keywords
Elementos ópticos difractivos, Privacidad, Reconocimiento de acciones, Preservación de la privacidad visual, Aprendizaje multimodal
Citation