Diseño de un lente para generar descripciones de imágenes preservando su privacidad

dc.contributor.advisorRueda Chacón, Hoover Fabian
dc.contributor.advisorSánchez Quiroga, Karen Yaneth
dc.contributor.authorArguello Gutiérrez, Paula Andrea
dc.contributor.evaluatorGalvis Carreño, Laura Viviana
dc.contributor.evaluatorPertuz Arroyo, Said David
dc.date.accessioned2024-08-20T13:48:14Z
dc.date.available2024-08-20T13:48:14Z
dc.date.created2024-08-19
dc.date.issued2024-08-19
dc.description.abstractLa generación de descripciones de imágenes consiste en resumir textualmente el contenido visual de una imagen. Esta tarea ha ganado popularidad en el cruce de dos áreas de la inteligencia artificial: visión por computadora y procesamiento de lenguaje natural. No obstante, en el enfoque convencional de descripción de imágenes, se utilizan imágenes de alta resolución para entrenar los modelos. Estas imágenes pueden incluir datos sensibles que deberían ser confidenciales, tales como rostros, características personales, documentos, menores de edad, etc., los cuales podrían estar sujetos a riesgos de privacidad. Este trabajo de grado se centra en proteger la privacidad en el proceso de descripción de imágenes, enfocándose directamente en la óptica antes de la adquisición de las imágenes. Dado la tendencia emergente de integrar el diseño óptico con la inteligencia artificial, se diseñó un lente refractivo para garantizar la privacidad. El lente optimizado oculta atributos visuales sensibles en la imagen adquirida, al tiempo que extrae características esenciales para las descripciones incluso a partir de imágenes muy distorsionadas. Con un enfoque de extremo a extremo, se logró un sistema capaz de crear descripciones directamente de imágenes distorsionadas mediante la optimización de este lente, junto con el desarrollo de una arquitectura de redes neuronales profundas para la generación de descripciones de imágenes. Este método fue probado y validado a través de simulaciones y experimentos en el laboratorio. Los resultados demostraron un mejor equilibrio entre privacidad y utilidad comparado con métodos tradicionales que no consideran la privacidad en diversos conjuntos de datos.
dc.description.abstractenglishImage caption generation consists of textually summarizing the visual content of an image. This task has gained popularity at the turning point of two areas of artificial intelligence: computer vision and natural language processing. However, high-resolution images are used to train the models in the conventional image captioning approach. These images may include sensitive data that should be confidential, such as faces, personal characteristics, documents, children, etc., which could be subject to privacy risks. This work focuses on protecting privacy in the image captioning process, approaching it directly from the image acquisition. Given the emerging trend of integrating optical design with artificial intelligence, a refractive lens was designed to ensure privacy. The optimized lens hides sensitive visual attributes in the acquired image while extracting essential features for captions even from highly distorted images. With an end-to-end approach, a system capable of creating captions directly from distorted images was achieved by optimizing this lens, together with the development of a deep neural network architecture to generate image captions. This method was tested and validated through simulations and real laboratory experiments. Results showed a better balance between privacy and usability compared to traditional methods that do not consider privacy in various datasets.
dc.description.cvlachttps://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001817493
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero de Sistemas
dc.description.googlescholarhttps://scholar.google.com/citations?user=TTo5b-cAAAAJ&hl=es
dc.description.orcidhttps://orcid.org/0000-0001-8266-8802
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/43784
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingeníerias Fisicomecánicas
dc.publisher.programIngeniería de Sistemas
dc.publisher.schoolEscuela de Ingeniería de Sistemas e Informática
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAtribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectPreservación de la privacidad
dc.subjectVisión por computadora
dc.subjectProcesamiento de lenguaje natural
dc.subjectDescripción de imágenes
dc.subjectDiseño de óptica
dc.subject.keywordPrivacy-preservation
dc.subject.keywordComputer Vision
dc.subject.keywordNatural Language Processing
dc.subject.keywordImage Captioning
dc.subject.keywordDeep Optics
dc.titleDiseño de un lente para generar descripciones de imágenes preservando su privacidad
dc.title.englishLens Design for Enhancing Privacy in Image Captioning
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Documento.pdf
Size:
17.73 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
78.61 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
515.86 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.18 KB
Format:
Item-specific license agreed to upon submission
Description: