Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz
dc.contributor.advisor | Sepulveda Sepulveda, Franklin Alexander | |
dc.contributor.author | Reyes Moreno, Julian Orlando | |
dc.contributor.author | Vasquez Serrano, Paula Andrea | |
dc.date.accessioned | 2024-03-03T23:57:12Z | |
dc.date.available | 2018 | |
dc.date.available | 2024-03-03T23:57:12Z | |
dc.date.created | 2018 | |
dc.date.issued | 2018 | |
dc.description.abstract | En este proyecto se presenta la evaluación de 5 diferentes modelos estadísticos de tipo lineal, a los cuales se les realizó el análisis de regresión para la estimación de la longitud del tracto de vocal, a partir de parámetros obtenidos de la voz humana. Para ello se hizo uso de la base de datos USC-TIMIT, la cual cuenta con una serie de audios e imágenes en tiempo real por resonancia magnética (rt-MRI) de 10 individuos, a partir de los cuales se extraen los parámetros necesarios para el ajuste y validación de los modelos. De esta forma, para la parametrización de la señal de la voz se utilizaron dos métodos diferentes: la codificación predictiva lineal (LPC) y los coeficientes cepstrales en las frecuencias de mel (MFCC). Los resultados obtenidos con cada uno de estos métodos fueron comparados, mostrando mejores resultados, en términos del error cuadrático medido, MFCC. Para la obtención de los valores de referencia de longitud del tracto vocal, se hizo uso de las imágenes por resonancia magnética, la cuales fueron procesadas con un algoritmo ya implementado en MATLAB. Se realizaron pruebas conformando diferentes grupos de datos, con el fin de observar el comportamiento de los modelos y la relación entre las variables. Además, se realizaron pruebas de validación cruzada de k-fold para la evaluación y comparación de los modelos. | |
dc.description.abstractenglish | The following document presents the evaluation of five different statistical models of linear type, to which the regression analysis were applied for the estimation of the vocal tract length from parameters of the human voice. For this purpose, the USCTIMIT database was used, this database has a set of audios and real-time magnetic resonance images (rt-MRI) of 10 speakers, from which the necessary parameters for the fit and validation of the models were extracted. Two different methods were used for the parameterization of the speech signal: the linear predictive coding (LPC), and the mel frequency cepstral coefficients (MFCC). The results obtained with these methods were compared, showing better results, in terms of the mean square error, the MFCC. The vocal tract length reference values were taken from the magnetic resonance images, this images were processed with an algorithm implemented in MATLAB. Tests were made forming different data sets, in order to analyze the behavior of the models, and the relation between the variables. In addition, k-fold cross validation tests were made for the evaluation and comparison of the models. | |
dc.description.degreelevel | Pregrado | |
dc.description.degreename | Ingeniero Electrónico | |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad Industrial de Santander | |
dc.identifier.reponame | Universidad Industrial de Santander | |
dc.identifier.repourl | https://noesis.uis.edu.co | |
dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/37829 | |
dc.language.iso | spa | |
dc.publisher | Universidad Industrial de Santander | |
dc.publisher.faculty | Facultad de Ingenierías Fisicomecánicas | |
dc.publisher.program | Ingeniería Electrónica | |
dc.publisher.school | Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones | |
dc.rights | http://creativecommons.org/licenses/by/4.0/ | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0 | |
dc.subject | Tracto Vocal | |
dc.subject | Formantes | |
dc.subject | Coeficientes Cepstrales En Las Frecuencias De Mel | |
dc.subject | Codificación Predictiva Lineal | |
dc.subject | Validación Cruzada | |
dc.subject | Imágenes Por Resonancia Magnética. | |
dc.subject.keyword | Vocal Tract | |
dc.subject.keyword | Formants | |
dc.subject.keyword | Mel Frequency Cepstral Coefficients | |
dc.subject.keyword | Linear Predictive Coding | |
dc.subject.keyword | Cross Validation | |
dc.subject.keyword | Magnetic Resonance Imaging. | |
dc.title | Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz | |
dc.title.english | Analysis of the relation between the vocal tract length, obtained from magnetic resonance imaging, and acoustic parameters of the voice. | |
dc.type.coar | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
dc.type.hasversion | http://purl.org/coar/resource_type/c_7a1f | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado |
Files
Original bundle
1 - 3 of 3
No Thumbnail Available
- Name:
- Carta de autorización.pdf
- Size:
- 2.03 MB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Nota de proyecto.pdf
- Size:
- 618.48 KB
- Format:
- Adobe Portable Document Format