DETECCIÓN DE LA ENFERMEDAD DE PARKINSON MEDIANTE LA VOZ USANDO TÉCNICAS DE MACHINE LEARNING

dc.contributor.advisorFajardo Ariza, Carlos Augusto
dc.contributor.authorDelgado Moreno, Jouver Fabian
dc.contributor.authorDuque Mantilla, Luzdey Sthefanny
dc.contributor.evaluatorSepúlveda Sepúlveda, Franklin Alexander
dc.contributor.evaluatorGarcía Arenas, Hans Yecid
dc.date.accessioned2025-02-25T17:15:29Z
dc.date.available2025-02-25T17:15:29Z
dc.date.created2025-02-23
dc.date.issued2025-02-23
dc.description.abstractLa enfermedad de Parkinson (EP) es un trastorno neurodegenerativo causado por la disminución de dopamina, afectando funciones motoras y no motoras. Esta deficiencia altera actividades como la generación del habla, que requiere la coordinación de estructuras como la laringe, cuerdas vocales y lengua. En pacientes con EP, esta coordinación se ve comprometida, provocando cambios significativos en las características del habla, afectando tanto la claridad como la fluidez de la comunicación. El objetivo de esta investigación se centró en la detección de la enfermedad de Parkinson a partir del análisis de características vocales usando dos bases de datos: PC-GITA, donde se extrajeron las características mediante el software Praat, y el conjunto de datos Parkinsons, que ya incluía características preprocesadas. Se seleccionaron las diez características más relevantes utilizando los métodos Chi cuadrado, clasificador Extra Tree y Matriz de Correlación. Se evaluaron diversos modelos de aprendizaje automático, incluidos Árbol de decisión o Decision Tree (DT), K- Vecinos Más Cercanos o K-Nearest Neighbors (KNN), Bosque Aleatorio o Random Forest (RF), Bagging, Ada Boosting y Gradient Boost, empleando las métricas de accuracy, precision, recall, F1-score, R2-score y AUC-ROC. Los resultados obtenidos sugieren que el modelo que demostró el mejor rendimiento fue Ada Boost, aplicado al conjunto de datos que combina todas las vocales en PC-GITA, donde alcanzó un AUC-ROC de 0.82 ± 0.04. Estos resultados indican que el modelo Ada Boost proporcionó las estimaciones más precisas y consistentes en nuestro estudio, resaltando su eficacia en la identificación de características asociadas con la enfermedad de Parkinson.
dc.description.abstractenglishParkinson's disease (PD) is a neurodegenerative disorder caused by a decrease in dopamine, affecting both motor and non-motor functions. This deficiency alters activities such as speech production, which requires the coordination of structures such as the larynx, vocal cords, and tongue. In patients with PD, this coordination is compromised, leading to significant changes in speech characteristics that affect both clarity and communication fluency. The objective of this research was to detect Parkinson's disease through the analysis of vocal features using two databases: PC-GITA, where the features were extracted using Praat software, and the Parkinsons dataset, which already included preprocessed features. The ten most relevant features were selected using the Chi-square method, Extra Tree classifier, and Correlation Matrix. Various machine learning models were evaluated, including Decision Tree (DT), K-Nearest Neighbors (KNN), Random Forest (RF), Bagging, Ada Boosting, and Gradient Boost, using the metrics of accuracy, precision, recall, F1-score, R2-score, and AUC-ROC. The results suggest that the model demonstrating the best performance was Ada Boost, applied to the dataset that combines all vowels in PC GITA, where it achieved an AUC-ROC of 0.82 ± 0.04. These findings indicate that the Ada Boost model provided the most precise and consistent estimates in our study, highlighting its effectiveness in identifying characteristics associated with Parkinson's disease.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Electrónico
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/45086
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingeníerias Fisicomecánicas
dc.publisher.programIngeniería Electrónica
dc.publisher.schoolEscuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAtribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectEnfermedad de Parkinson (EP)
dc.subjectAprendizaje Automático
dc.subjectClasificadores
dc.subject.keywordMachine Learning
dc.subject.keywordParkinson's Disease (PD)
dc.subject.keywordClassifiers
dc.titleDETECCIÓN DE LA ENFERMEDAD DE PARKINSON MEDIANTE LA VOZ USANDO TÉCNICAS DE MACHINE LEARNING
dc.title.englishDETECTION OF PARKINSON'S DISEASE THROUGH VOICE USING MACHINE LEARNING
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
115.67 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
164.44 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
834.46 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.18 KB
Format:
Item-specific license agreed to upon submission
Description: