Logotipo del repositorio

Publicación:
Sistema de reconocimiento de fonemas basado en mfccs y parámetros articulatorios

dc.contributor.advisorSepulveda, Franklin Alexander
dc.contributor.authorPatiño Saucedo, Alberto
dc.date.accessioned2024-03-03T22:06:40Z
dc.date.available2015
dc.date.available2024-03-03T22:06:40Z
dc.date.created2015
dc.date.issued2015
dc.description.abstractCon la llegada de la era digital, la comprensión del lenguaje hablado por parte de los sistemas computacionales ha visto un desarrollo notable, pero en el caso del reconocimiento de fonemas aún se sigue investigando para lograr un reconocimiento cada vez más preciso. En este trabajo de grado se muestra que la información contenida en los datos articulatorios puede ayudar a mejorar las tasas de reconocimiento del habla a nivel fonético. Para ello se han construido dos sistemas de reconocimiento de fonemas dependientes del hablante: un sistema base que parametriza la señal de voz en forma de Coeficientes Cepstrales en la escala de Mel (MFCCs por sus siglas en inglés) y otro que combina los parámetros MFCCs con los datos de articulografía electromagnética (EMA, por sus siglas en inglés). Los datos de entrenamiento y validación fueron tomados de la base de datos MOCHA-TIMIT. De la implementación de los sistemas, se observa una mejoría en la precisión del sistema base cuando se le agregan los datos articulatorios de un 11 %, llegando a tenerse una tasa de precisión alrededor del 70 %. Estos resultados demuestran que los datos articulatorios poseen información útil que adicionada a las señales acústicas parametrizadas pueden utilizarse para mejorar el rendimiento de los sistemas de reconocimiento de fonemas.
dc.description.abstractenglishWith the arrival of the digital age, the understanding of speech by computer systems has seen a remarkable development, but in the case of phone recognition there is still research to do in order to achieve a more precise recognition. In this research work it is shown that the information included in the articulatory data can help to improve speech recognition rates at the phonetic level. In order to achieve this, two speaker-dependent phoneme recognition systems have been built: a baseline system that codes the voice signal in the form of Mel Frequency Cepstral Coefficientes (MFCCs) and a second system that combines both MFCCs and articulatory (EMA) data. The training and testing data were taken from the MOCHA-TIMIT database. From the implementation of both systems, it has been observed an improvement of about 11 % in the accuracy rate of the baseline system when articulatory data is added, reaching around 70 %. These scores prove that articulatory data hold useful information that being added to the feature vectors of the acoustic signals are able to improve the performance of phoneme recognition systems.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Electrónico
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/32537
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programIngeniería Electrónica
dc.publisher.schoolEscuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
dc.rightshttp://creativecommons.org/licenses/by/4.0/
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0
dc.subjectReconocimiento De Fonemas
dc.subjectParámetros Articulatorios
dc.subjectCoeficientes Cepstrales En La Escala De Mel
dc.subjectModelos Ocultos De Markov
dc.subject.keywordPhone Recognition
dc.subject.keywordArticulatory Parameters
dc.subject.keywordMel-Cepstrum Coeficcients
dc.subject.keywordHidden Markov Models
dc.titleSistema de reconocimiento de fonemas basado en mfccs y parámetros articulatorios
dc.title.englishPhone recognition based on mfccs and articulatory parameters
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.typePublication

Archivos

Bloque original

Mostrando 1 - 3 de 3
Cargando...
Miniatura
Nombre:
Carta de autorización.pdf
Tamaño:
97.59 KB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Documento.pdf
Tamaño:
3.3 MB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Nota de proyecto.pdf
Tamaño:
2.1 MB
Formato:
Adobe Portable Document Format

VIGILADA MINEDUCACIÓN

Ordenanza No. 83 de 1.944 (junio 22)

Carácter académico: Universidad

Notificaciones judiciales: notjudiciales@uis.edu.co 

.

Código SNIES: 1204   Nit: 890.201.213-4

Línea Anticorrupción:  +57 (601) 562 9300 EXT: 3633

Línea transparente: +57 (607) 630 3031