Evaluacion de la informacion articulatoria como medio para mejorar el desempeño de los sistemas de verificacion del hablante
dc.contributor.advisor | Sepúlveda Sepúlveda, Franklin Alexánder | |
dc.contributor.author | Porras Plata, Dagoberto | |
dc.date.accessioned | 2023-04-06T20:23:07Z | |
dc.date.available | 2023 | |
dc.date.available | 2023-04-06T20:23:07Z | |
dc.date.created | 2019 | |
dc.date.issued | 2019 | |
dc.description.abstract | Los sistemas barométricos basados en voz son de las formas más preferidos para la gestión de identidad debido a su flexibilidad, velocidad y costo reducido. Sin embargo, se sabe que los sistemas actuales pueden verse afectados por variaciones inesperadas durante la fase de validación, tales como ruido de entorno o cambios en el esfuerzo vocal. En este trabajo se evalúa la información articulatoria del movimiento de la lengua como medio para mejorar el desempeño de los sistemas de verificación del hablante (SVH). Se utilizó una base de datos en español, donde además de las señales de voz, también se adquiere información articulatoria con un sistema de ultrasonido. Se proponen dos grupos de características para representar la información articulatoria y el desempeño obtenido es comparado con un SVH entrenado únicamente con información acústica. Los resultados muestran que las características propuestas contienen gran cantidad de información discriminativa y altamente asociada a la identidad de los hablantes, además que se pueden emplear para complementar y mejorar SVH existentes como por ejemplo combinando dicha información con coeficientes cepstrales. Un resultado adicional que puede encontrarse en éste documento, es un mapeo acústico-articulatorio desarrollado con Deep Learning, donde se estiman secuencias de imágenes de ultrasonido a partir de las muestras de audio; como trabajo futuro esta información articulatoria estimada, podría incluirse al SVH propuesto. | |
dc.description.abstractenglish | Speech-based biometrics is one of the most preferred methods for identity management due to its flexibility, speed and reduced cost. However, current state-of-the-art speaker verification (SV) systems are known to be strongly affected by unexpected variability presented during testing, such as environmental noise or changes in vocal effort. In this work we analyze and evaluate articulatory information of the tongue’s movement as a mean to improve the performance of speaker verification systems. We use a Spanish database, where besides the speech signals, we also include articulatory information which was acquired with an ultrasound system. Two groups of features are proposed to represent the articulatory information and the obtained performance is compared with an SV system trained only with acoustic information. Our results show that proposed features contain highly discriminative information and it is related to speaker identity, furthermore, these features can be used to complement and improve existing systems by combining such information with cepstral coefficients at the feature level. An additional result that can be found in this document is an acoustic-articulatory mapping developed with Deep Learning, where sequences of ultrasound images are estimated from the audio samples; as future work this estimated articulatory information could be included in the proposed SVH. | |
dc.description.degreelevel | Maestría | |
dc.description.degreename | Magíster en Ingeniería Electrónica | |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad Industrial de Santander | |
dc.identifier.reponame | Universidad Industrial de Santander | |
dc.identifier.repourl | https://noesis.uis.edu.co | |
dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/14021 | |
dc.language.iso | spa | |
dc.publisher | Universidad Industrial de Santander | |
dc.publisher.faculty | Facultad de Ingenierías Fisicomecánicas | |
dc.publisher.program | Maestría en Ingeniería Electrónica | |
dc.publisher.school | Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Gmm | |
dc.subject | Ubm | |
dc.subject | Python | |
dc.subject | I-Vector | |
dc.subject | Ultrasonido | |
dc.subject | Verificación Del Hablante. | |
dc.subject.keyword | Gmm | |
dc.subject.keyword | Ubm | |
dc.subject.keyword | Python | |
dc.subject.keyword | Ultrasound | |
dc.subject.keyword | Speaker Verification | |
dc.title | Evaluacion de la informacion articulatoria como medio para mejorar el desempeño de los sistemas de verificacion del hablante | |
dc.title.english | Evaluation of articulatory information as a means to improve the performance of speaker verification systems | |
dc.type.coar | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
dc.type.hasversion | http://purl.org/coar/resource_type/c_bdcc | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Maestría | |
dspace.entity.type |
Files
Original bundle
1 - 3 of 3
No Thumbnail Available
- Name:
- Carta de autorización.pdf
- Size:
- 1.79 MB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Documento.pdf
- Size:
- 17.15 MB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Nota de proyecto.pdf
- Size:
- 603.86 KB
- Format:
- Adobe Portable Document Format