Publicación: Clasificación de patrones parkinsonianos integrando información gesto-auditiva por medio de una estrategia multimodal
| dc.contributor.advisor | Martínez Carrillo, Fabio | |
| dc.contributor.advisor | Moreno Tarazona, Alejandra | |
| dc.contributor.author | Valera Sánchez, José Daniel | |
| dc.contributor.evaluator | Rueda Chacón, Hoover Fabian | |
| dc.contributor.evaluator | Garzón Villamizar, Gustavo Adolfo | |
| dc.date.accessioned | 2025-05-14T14:37:09Z | |
| dc.date.available | 2025-05-14T14:37:09Z | |
| dc.date.created | 2025-05-13 | |
| dc.date.issued | 2025-05-13 | |
| dc.description.abstract | La enfermedad de Parkinson se caracteriza por una degeneración progresiva del sistema nervioso, afectando las neuronas dopaminérgicas. Es la segunda enfermedad neurodegenerativa más prevalente a nivel mundial. A nivel global, se estiman entre 5 y 35 nuevos casos por cada 100, 000 individuos, con una prevalencia del 3% en personas mayores de 80 años. En Colombia, en 2016, se estimaron 26, 000 casos y se reportaron 800 muertes asociadas a esta enfermedad. Entre los síntomas más característicos se encuentran desórdenes del habla, como disminución del volumen de voz, mala articulación y falta de inflexión tonal, así como la hipomimia facial, afectando la calidad de vida del paciente. Debido al carácter multisintomático de esta enfermedad, es fundamental desarrollar esquemas de diagnóstico multimodales que integren patrones motores y de habla para mejorar su detección y tratamiento. Este trabajo propuso un enfoque basado en una red de auto-atención multimodal para analizar datos audiovisuales de pacientes con Parkinson y sujetos control. Las señales de audio y video fueron procesadas mediante arquitecturas profundas diseñadas para extraer características relevantes de cada modalidad. Posteriormente, estas representaciones fueron integradas mediante un mecanismo de auto-atención para capturar relaciones internas entre modalidades. La red fue ajustada durante una tarea de clasificación binaria (Control vs. Parkinson) utilizando fonemas, vocales sostenidas y palabras como ejercicios evaluativos. Los resultados obtenidos fueron competitivos, alcanzando una precisión de 74.19%, recall de 73.02% y un AUC de 75.26% para fonemas. Para vocales sostenidas, el modelo alcanzó una precisión de 65.19%, recall de 83.81% y un AUC de 70.78%, demostrando la efectividad del método en la discriminación de patrones relacionados con la enfermedad de Parkinson. | |
| dc.description.abstractenglish | Parkinson’s disease is characterized by a progressive degeneration of the nervous system that primarily affects the neurons responsible for producing dopamine. It is currently recognized as the second most prevalent neurodegenerative condition worldwide. Globally, an estimated 5 to 35 new cases per 100, 000 individuals occur each year, with a prevalence of 3% in individuals over the age of 80. In Colombia, by 2016, there were 26, 000 reported cases, with 800 deaths attributed to this disease. Among its most characteristic symptoms are speech disorders, including reduced voice volume, poor articulation, and lack of tonal inflection, as well as facial hypomimia, which significantly impacts patients’ quality of life. Due to the multisymptomatic nature of this disease, it is essential to develop multimodal diagnostic schemes that integrate motor and speech patterns to enhance detection and treatment strategies. This work proposed a multimodal self-attention-based approach to analyze audiovisual data from Parkinson’s patients and control subjects. Audio and video signals were represented using deep learning architectures specifically designed to extract relevant features from each modality. Subsequently, these representations were integrated using a self-attention mechanism to capture internal relationships and relevant patterns between modalities. The network was trained for a binary classification task (Control vs. Parkinson) using phonemes, sustained vowels, and words as evaluative exercises. The obtained results were competitive, achieving an accuracy of 74.19%, a recall value of 73.02%, and an AUC of 75.26% for phonemes. For sustained vowels, the model reached an accuracy of 65.19%, a recall value of 83.81%, and an AUC of 70.78%, demonstrating the effectiveness of the proposed method in discriminating patterns related to Parkinson’s disease. | |
| dc.description.degreelevel | Pregrado | |
| dc.description.degreename | Ingeniero de Sistemas | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | Universidad Industrial de Santander | |
| dc.identifier.reponame | Universidad Industrial de Santander | |
| dc.identifier.repourl | https://noesis.uis.edu.co | |
| dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/45463 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Industrial de Santander | |
| dc.publisher.faculty | Facultad de Ingeníerias Fisicomecánicas | |
| dc.publisher.program | Ingeniería de Sistemas | |
| dc.publisher.school | Escuela de Ingeniería de Sistemas e Informática | |
| dc.rights | info:eu-repo/semantics/openAccess | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.license | Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO) | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Enfermedad de Parkinson | |
| dc.subject | Clasificación | |
| dc.subject | Metodologías convolucionales | |
| dc.subject | Mecanismo de auto-atención | |
| dc.subject | Representaciones discriminativas | |
| dc.subject | Información audiovisual | |
| dc.subject.keyword | Parkinson's disease | |
| dc.subject.keyword | Classification | |
| dc.subject.keyword | Convolutional neural networks | |
| dc.subject.keyword | Self-attention mechanism | |
| dc.subject.keyword | Discriminative Representations | |
| dc.subject.keyword | Audiovisual information | |
| dc.title | Clasificación de patrones parkinsonianos integrando información gesto-auditiva por medio de una estrategia multimodal | |
| dc.title.english | Parkinsonian patterns classification integrating gest-auditive information using a multimodal strategy | |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.hasversion | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
| dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
| dspace.entity.type | Publication |
Archivos
Bloque original
1 - 3 de 3
Cargando...
- Nombre:
- Carta de autorización.pdf
- Tamaño:
- 87.83 KB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- Carta de autorización.pdf
- Tamaño:
- 194.47 KB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 2.18 KB
- Formato:
- Item-specific license agreed to upon submission
- Descripción:
