Diseño de un lente para generar descripciones de imágenes preservando su privacidad

Abstract
La generación de descripciones de imágenes consiste en resumir textualmente el contenido visual de una imagen. Esta tarea ha ganado popularidad en el cruce de dos áreas de la inteligencia artificial: visión por computadora y procesamiento de lenguaje natural. No obstante, en el enfoque convencional de descripción de imágenes, se utilizan imágenes de alta resolución para entrenar los modelos. Estas imágenes pueden incluir datos sensibles que deberían ser confidenciales, tales como rostros, características personales, documentos, menores de edad, etc., los cuales podrían estar sujetos a riesgos de privacidad. Este trabajo de grado se centra en proteger la privacidad en el proceso de descripción de imágenes, enfocándose directamente en la óptica antes de la adquisición de las imágenes. Dado la tendencia emergente de integrar el diseño óptico con la inteligencia artificial, se diseñó un lente refractivo para garantizar la privacidad. El lente optimizado oculta atributos visuales sensibles en la imagen adquirida, al tiempo que extrae características esenciales para las descripciones incluso a partir de imágenes muy distorsionadas. Con un enfoque de extremo a extremo, se logró un sistema capaz de crear descripciones directamente de imágenes distorsionadas mediante la optimización de este lente, junto con el desarrollo de una arquitectura de redes neuronales profundas para la generación de descripciones de imágenes. Este método fue probado y validado a través de simulaciones y experimentos en el laboratorio. Los resultados demostraron un mejor equilibrio entre privacidad y utilidad comparado con métodos tradicionales que no consideran la privacidad en diversos conjuntos de datos.
Description
Keywords
Preservación de la privacidad, Visión por computadora, Procesamiento de lenguaje natural, Descripción de imágenes, Diseño de óptica
Citation