Sistema de reconocimiento de fonemas basado en mfccs y parámetros articulatorios

Patiño Saucedo, Alberto

Publicación:
Sistema de reconocimiento de fonemas basado en mfccs y parámetros articulatorios

dc.contributor.advisor	Sepulveda, Franklin Alexander
dc.contributor.author	Patiño Saucedo, Alberto
dc.date.accessioned	2024-03-03T22:06:40Z
dc.date.available	2015
dc.date.available	2024-03-03T22:06:40Z
dc.date.created	2015
dc.date.issued	2015
dc.description.abstract	Con la llegada de la era digital, la comprensión del lenguaje hablado por parte de los sistemas computacionales ha visto un desarrollo notable, pero en el caso del reconocimiento de fonemas aún se sigue investigando para lograr un reconocimiento cada vez más preciso. En este trabajo de grado se muestra que la información contenida en los datos articulatorios puede ayudar a mejorar las tasas de reconocimiento del habla a nivel fonético. Para ello se han construido dos sistemas de reconocimiento de fonemas dependientes del hablante: un sistema base que parametriza la señal de voz en forma de Coeficientes Cepstrales en la escala de Mel (MFCCs por sus siglas en inglés) y otro que combina los parámetros MFCCs con los datos de articulografía electromagnética (EMA, por sus siglas en inglés). Los datos de entrenamiento y validación fueron tomados de la base de datos MOCHA-TIMIT. De la implementación de los sistemas, se observa una mejoría en la precisión del sistema base cuando se le agregan los datos articulatorios de un 11 %, llegando a tenerse una tasa de precisión alrededor del 70 %. Estos resultados demuestran que los datos articulatorios poseen información útil que adicionada a las señales acústicas parametrizadas pueden utilizarse para mejorar el rendimiento de los sistemas de reconocimiento de fonemas.
dc.description.abstractenglish	With the arrival of the digital age, the understanding of speech by computer systems has seen a remarkable development, but in the case of phone recognition there is still research to do in order to achieve a more precise recognition. In this research work it is shown that the information included in the articulatory data can help to improve speech recognition rates at the phonetic level. In order to achieve this, two speaker-dependent phoneme recognition systems have been built: a baseline system that codes the voice signal in the form of Mel Frequency Cepstral Coefficientes (MFCCs) and a second system that combines both MFCCs and articulatory (EMA) data. The training and testing data were taken from the MOCHA-TIMIT database. From the implementation of both systems, it has been observed an improvement of about 11 % in the accuracy rate of the baseline system when articulatory data is added, reaching around 70 %. These scores prove that articulatory data hold useful information that being added to the feature vectors of the acoustic signals are able to improve the performance of phoneme recognition systems.
dc.description.degreelevel	Pregrado
dc.description.degreename	Ingeniero Electrónico
dc.format.mimetype	application/pdf
dc.identifier.instname	Universidad Industrial de Santander
dc.identifier.reponame	Universidad Industrial de Santander
dc.identifier.repourl	https://noesis.uis.edu.co
dc.identifier.uri	https://noesis.uis.edu.co/handle/20.500.14071/32537
dc.language.iso	spa
dc.publisher	Universidad Industrial de Santander
dc.publisher.faculty	Facultad de Ingenierías Fisicomecánicas
dc.publisher.program	Ingeniería Electrónica
dc.publisher.school	Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
dc.rights	http://creativecommons.org/licenses/by/4.0/
dc.rights.accessrights	info:eu-repo/semantics/openAccess
dc.rights.creativecommons	Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.license	Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.uri	http://creativecommons.org/licenses/by-nc/4.0
dc.subject	Reconocimiento De Fonemas
dc.subject	Parámetros Articulatorios
dc.subject	Coeficientes Cepstrales En La Escala De Mel
dc.subject	Modelos Ocultos De Markov
dc.subject.keyword	Phone Recognition
dc.subject.keyword	Articulatory Parameters
dc.subject.keyword	Mel-Cepstrum Coeficcients
dc.subject.keyword	Hidden Markov Models
dc.title	Sistema de reconocimiento de fonemas basado en mfccs y parámetros articulatorios
dc.title.english	Phone recognition based on mfccs and articulatory parameters
dc.type.coar	http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversion	http://purl.org/coar/resource_type/c_7a1f
dc.type.local	Tesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.type	Publication