Structured and continuous video sign language recognition

Rodríguez Chivatá, Jefferson David

Structured and continuous video sign language recognition

dc.contributor.advisor	Martínez Carrillo, Fabio
dc.contributor.author	Rodríguez Chivatá, Jefferson David
dc.date.accessioned	2024-03-04T01:18:02Z
dc.date.available	2021
dc.date.available	2024-03-04T01:18:02Z
dc.date.created	2021
dc.date.issued	2021
dc.description.abstract	Las lenguas de señas son el principal mecanismo de comunicación en la comunidad sorda. Estas lenguas son muy variables en la comunicación, con divergencias entre la representación de los gestos, la configuración de los signos y múltiples variantes debido a aspectos culturales. Los métodos actuales para la traducción automática y continua de signos incluyen modelos de aprendizaje profundo que codifican la representación visual de los signos. A pesar de los importantes avances, la convergencia de estos modelos requiere enormes cantidades de datos para explotar la representación de las señas, lo que da lugar a modelos muy complejos. Este hecho se asocia a la mayor variabilidad, pero también a la escasa exploración de muchos componentes del lenguaje que sustentan la comunicación. Por ejemplo, el movimiento gestual y la estructura gramatical son componentes fundamentales en la comunicación, que pueden hacer frente a interpretaciones erróneas de los signos visuales y geométricos durante el análisis del vídeo. Este trabajo introduce una arquitectura compacta para la traducción de señas a texto que explora el movimiento como alternativa para apoyar la traducción de signos. Dicha caracterización resulta robusta a la varianza de la apariencia con apoyo a las variaciones geométricas. Además, este trabajo propone dos módulos que aportan robustez al componente estructural reflejado directamente en la traducción. La arquitectura propuesta se evaluó en un conjunto de datos propio de lengua de señas colombiana construido específicamente para esta tarea (CoL-SLTD) dedicado al estudio del movimiento y de la estructura de las oraciones, también en un conjunto de datos del estado del arte llamado RWTH-Phoenixweather. Del conjunto de datos CoL-SLTD, la mejor configuración reporta una puntuación BLEU-4 de 35.81 en el conjunto de pruebas. En cuanto al RWTH-Phoenix-weather, la estrategia propuesta alcanzó una puntuación BLEU-4 en prueba de 4.65 mejorando los resultados en condiciones reducidas similares.
dc.description.abstractenglish	Sign languages are the main mechanism of communication in the deaf community. These languages are highly variable in communication, with divergence in gesture representation, sign configuration and multiple variants due to cultural aspects. Current methods for automatic and continuous sign translation include deep learning models that encode the visual representation of signs. Despite significant advances, the convergence of these models requires huge amounts of data to exploit the sign representation, resulting in very complex models. This fact is associated with increased variability, but also with the limited exploration of many components of language that support communication. For example, gestural movement and grammatical structure are fundamental components in communication, which can address misinterpretations of visual and geometric signs during video analysis. This paper introduces a compact architecture for sign-to-text translation that explores motion as an alternative to support sign translation. Such a characterization is robust to appearance variance with support for geometric variations. In addition, this work proposes two modules that provide robustness to the structural component directly reflected in the translation. The proposed architecture was evaluated on a own Colombian Sign Language dataset built specifically for this task (CoL-SLTD) dedicated to the study of motion and sentence structure, also on a state-of-the-art dataset called RWTH-Phoenix-weather. From the CoL-SLTD dataset, the best configuration reports a BLEU-4 score of 35.81 on the test set. As for the RWTH-Phoenix-weather, the proposed strategy achieved a BLEU-4 score in test set of 4.65 improving the results in similar reduced conditions.
dc.description.degreelevel	Maestría
dc.description.degreename	Magíster en Ingeniería de Sistemas e Informática
dc.format.mimetype	application/pdf
dc.identifier.instname	Universidad Industrial de Santander
dc.identifier.reponame	Universidad Industrial de Santander
dc.identifier.repourl	https://noesis.uis.edu.co
dc.identifier.uri	https://noesis.uis.edu.co/handle/20.500.14071/41584
dc.language.iso	spa
dc.publisher	Universidad Industrial de Santander
dc.publisher.faculty	Facultad de Ingenierías Fisicomecánicas
dc.publisher.program	Maestría en Ingeniería de Sistemas e Informática
dc.publisher.school	Escuela de Ingeniería de Sistemas e Informática
dc.rights	http://creativecommons.org/licenses/by/4.0/
dc.rights.accessrights	info:eu-repo/semantics/openAccess
dc.rights.creativecommons	Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.license	Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.uri	http://creativecommons.org/licenses/by-nc/4.0
dc.subject	Reconocimiento Continuo De Signos
dc.subject	Lengua De Señas
dc.subject	Patrones De Forma Y Movimiento
dc.subject	Reconocimiento Estructurado.
dc.subject.keyword	Sign Language Translation
dc.subject.keyword	Continuous Sign Recognition
dc.subject.keyword	Sign Language
dc.subject.keyword	Shape And Motion Patterns.
dc.title	Structured and continuous video sign language recognition
dc.title.english	Structured and continuous video sign language recognition
dc.type.coar	http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversion	http://purl.org/coar/resource_type/c_bdcc
dc.type.local	Tesis/Trabajo de grado - Monografía - Maestria

Files

Original bundle

Now showing 1 - 3 of 3

Name:: Carta de autorización.pdf
Size:: 130.29 KB
Format:: Adobe Portable Document Format

Download

Name:: Documento.pdf
Size:: 4.24 MB
Format:: Adobe Portable Document Format

Download

Name:: Nota de proyecto.pdf
Size:: 110.15 KB
Format:: Adobe Portable Document Format

Download

Collections

Maestría en Ingeniería de Sistemas e Informática