Análisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz

dc.contributor.advisorSepulveda Sepulveda, Franklin Alexander
dc.contributor.authorReyes Moreno, Julian Orlando
dc.contributor.authorVasquez Serrano, Paula Andrea
dc.date.accessioned2024-03-03T23:57:12Z
dc.date.available2018
dc.date.available2024-03-03T23:57:12Z
dc.date.created2018
dc.date.issued2018
dc.description.abstractEn este proyecto se presenta la evaluación de 5 diferentes modelos estadísticos de tipo lineal, a los cuales se les realizó el análisis de regresión para la estimación de la longitud del tracto de vocal, a partir de parámetros obtenidos de la voz humana. Para ello se hizo uso de la base de datos USC-TIMIT, la cual cuenta con una serie de audios e imágenes en tiempo real por resonancia magnética (rt-MRI) de 10 individuos, a partir de los cuales se extraen los parámetros necesarios para el ajuste y validación de los modelos. De esta forma, para la parametrización de la señal de la voz se utilizaron dos métodos diferentes: la codificación predictiva lineal (LPC) y los coeficientes cepstrales en las frecuencias de mel (MFCC). Los resultados obtenidos con cada uno de estos métodos fueron comparados, mostrando mejores resultados, en términos del error cuadrático medido, MFCC. Para la obtención de los valores de referencia de longitud del tracto vocal, se hizo uso de las imágenes por resonancia magnética, la cuales fueron procesadas con un algoritmo ya implementado en MATLAB. Se realizaron pruebas conformando diferentes grupos de datos, con el fin de observar el comportamiento de los modelos y la relación entre las variables. Además, se realizaron pruebas de validación cruzada de k-fold para la evaluación y comparación de los modelos.
dc.description.abstractenglishThe following document presents the evaluation of five different statistical models of linear type, to which the regression analysis were applied for the estimation of the vocal tract length from parameters of the human voice. For this purpose, the USCTIMIT database was used, this database has a set of audios and real-time magnetic resonance images (rt-MRI) of 10 speakers, from which the necessary parameters for the fit and validation of the models were extracted. Two different methods were used for the parameterization of the speech signal: the linear predictive coding (LPC), and the mel frequency cepstral coefficients (MFCC). The results obtained with these methods were compared, showing better results, in terms of the mean square error, the MFCC. The vocal tract length reference values were taken from the magnetic resonance images, this images were processed with an algorithm implemented in MATLAB. Tests were made forming different data sets, in order to analyze the behavior of the models, and the relation between the variables. In addition, k-fold cross validation tests were made for the evaluation and comparison of the models.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Electrónico
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/37829
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programIngeniería Electrónica
dc.publisher.schoolEscuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
dc.rightshttp://creativecommons.org/licenses/by/4.0/
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0
dc.subjectTracto Vocal
dc.subjectFormantes
dc.subjectCoeficientes Cepstrales En Las Frecuencias De Mel
dc.subjectCodificación Predictiva Lineal
dc.subjectValidación Cruzada
dc.subjectImágenes Por Resonancia Magnética.
dc.subject.keywordVocal Tract
dc.subject.keywordFormants
dc.subject.keywordMel Frequency Cepstral Coefficients
dc.subject.keywordLinear Predictive Coding
dc.subject.keywordCross Validation
dc.subject.keywordMagnetic Resonance Imaging.
dc.titleAnálisis de la relación existente entre la longitud del tracto vocal, obtenida a partir de imágenes por resonancia magnética, y parámetros acústicos de la voz
dc.title.englishAnalysis of the relation between the vocal tract length, obtained from magnetic resonance imaging, and acoustic parameters of the voice.
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
2.03 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
4.32 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
618.48 KB
Format:
Adobe Portable Document Format