Publicación: Sistema de reconocimiento de fonemas basado en mfccs y parámetros articulatorios
Portada
Citas bibliográficas
Gestores Bibliográficos
Código QR
Autor/a
Director
Autor corporativo
Recolector de datos
Otros/Desconocido
Director audiovisual
Editor
Fecha
Citación
Título de serie/ reporte/ volumen/ colección
Es Parte de
Resumen
Con la llegada de la era digital, la comprensión del lenguaje hablado por parte de los sistemas computacionales ha visto un desarrollo notable, pero en el caso del reconocimiento de fonemas aún se sigue investigando para lograr un reconocimiento cada vez más preciso. En este trabajo de grado se muestra que la información contenida en los datos articulatorios puede ayudar a mejorar las tasas de reconocimiento del habla a nivel fonético. Para ello se han construido dos sistemas de reconocimiento de fonemas dependientes del hablante: un sistema base que parametriza la señal de voz en forma de Coeficientes Cepstrales en la escala de Mel (MFCCs por sus siglas en inglés) y otro que combina los parámetros MFCCs con los datos de articulografía electromagnética (EMA, por sus siglas en inglés). Los datos de entrenamiento y validación fueron tomados de la base de datos MOCHA-TIMIT. De la implementación de los sistemas, se observa una mejoría en la precisión del sistema base cuando se le agregan los datos articulatorios de un 11 %, llegando a tenerse una tasa de precisión alrededor del 70 %. Estos resultados demuestran que los datos articulatorios poseen información útil que adicionada a las señales acústicas parametrizadas pueden utilizarse para mejorar el rendimiento de los sistemas de reconocimiento de fonemas.

PDF
FLIP 
