DETECCIÓN DE LA ENFERMEDAD DE PARKINSON MEDIANTE LA VOZ USANDO TÉCNICAS DE MACHINE LEARNING

Abstract
La enfermedad de Parkinson (EP) es un trastorno neurodegenerativo causado por la disminución de dopamina, afectando funciones motoras y no motoras. Esta deficiencia altera actividades como la generación del habla, que requiere la coordinación de estructuras como la laringe, cuerdas vocales y lengua. En pacientes con EP, esta coordinación se ve comprometida, provocando cambios significativos en las características del habla, afectando tanto la claridad como la fluidez de la comunicación. El objetivo de esta investigación se centró en la detección de la enfermedad de Parkinson a partir del análisis de características vocales usando dos bases de datos: PC-GITA, donde se extrajeron las características mediante el software Praat, y el conjunto de datos Parkinsons, que ya incluía características preprocesadas. Se seleccionaron las diez características más relevantes utilizando los métodos Chi cuadrado, clasificador Extra Tree y Matriz de Correlación. Se evaluaron diversos modelos de aprendizaje automático, incluidos Árbol de decisión o Decision Tree (DT), K- Vecinos Más Cercanos o K-Nearest Neighbors (KNN), Bosque Aleatorio o Random Forest (RF), Bagging, Ada Boosting y Gradient Boost, empleando las métricas de accuracy, precision, recall, F1-score, R2-score y AUC-ROC. Los resultados obtenidos sugieren que el modelo que demostró el mejor rendimiento fue Ada Boost, aplicado al conjunto de datos que combina todas las vocales en PC-GITA, donde alcanzó un AUC-ROC de 0.82 ± 0.04. Estos resultados indican que el modelo Ada Boost proporcionó las estimaciones más precisas y consistentes en nuestro estudio, resaltando su eficacia en la identificación de características asociadas con la enfermedad de Parkinson.
Description
Keywords
Enfermedad de Parkinson (EP), Aprendizaje Automático, Clasificadores
Citation