Publicación: Análisis de un sistema para la verificación de locutores utilizando la transformación de Fourier de orden fraccional
| dc.contributor.advisor | Torres Moreno, Yesid | |
| dc.contributor.advisor | Barrero Pérez, Jaime Guillermo | |
| dc.contributor.author | Bertel Mendoza, David Daniel | |
| dc.contributor.author | Maldonado Orduz, Edgar Fernando | |
| dc.date.accessioned | 2024-03-03T18:42:52Z | |
| dc.date.available | 2011 | |
| dc.date.available | 2024-03-03T18:42:52Z | |
| dc.date.created | 2011 | |
| dc.date.issued | 2011 | |
| dc.description.abstract | Dentro del ámbito del reconocimiento de personas por medio de características biométricas, la voz es sin duda la más natural de todas. Por otro lado, la implementación de aplicaciones que hacen uso del reconocimiento de voz, no necesita de infraestructura diferente, o por lo menos, no muy diferente a la que se tiene actualmente en telefonía y en sistemas de comunicación. La extracción de características de la voz representadas por los coeficientes cepstrales de Mel y los coeficientes LPC, o una combinación de estas dos representaciones, es una técnica que ha producido buenos resultados en el reconocimiento y verificación del habla y del hablante, pero la caracterización aún no satisface los objetivos de un sistema de verificación seguro. La transformación de Fourier fraccionaria (FrFT) es una generalización de la transformación de Fourier estándar (FT), donde la señal es representada en un espacio tiempo-frecuencia. En este trabajo se analiza el efecto de utilizar la transformada de Fourier de fraccionaria como método de la caracterización de la voz en un sistema de verificación de locutores dependiente del texto basado en Coeficientes Cepstrales en las Frecuencias de Mel (MFCC). Para ello, la señal de voz es representada en el dominio fraccionario, tiempo-frecuencia, teniéndose la posibilidad de encontrar un dominio fraccionario que mejore la representación del locutor. La factibilidad para la verificación de un individuo por su voz es abordada en este espacio de representación. | |
| dc.description.abstractenglish | In the field of pattern recognition speech is undoubtedly the most natural signal. Besides, speech recognition-based applications do not need different networks because actual communication systems provide a network for speech signal processing. The extraction of speech characteristics through Mel Frequency Cepstral Coefficients (MFCC) and Linear Predictive Coding (LPC) coefficients, or a combination of these representations, is a well-known technique that had produced good results in speech and speaker recognition and verification, but speech characterization does not satisfy secure verification system objectives yet. The Fractional Fourier Transform (FrFT) is a generalization of the Fourier Transform (FT), which characterizes a signal in a time-frequency space. In this work is analyzes the effect of use Fractional Fourier Transform as a speech parameterization method inside a text-dependent MFCC-based speaker verification system. For that, speech signal is represented in a time-frequency fractional domain, with the possibility of find a fractional domain where speech representation is better. The feasibility to verify a person through his voice is treated in this representation space. | |
| dc.description.degreelevel | Pregrado | |
| dc.description.degreename | Ingeniero Electrónico | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | Universidad Industrial de Santander | |
| dc.identifier.reponame | Universidad Industrial de Santander | |
| dc.identifier.repourl | https://noesis.uis.edu.co | |
| dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/25541 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Industrial de Santander | |
| dc.publisher.faculty | Facultad de Ingenierías Fisicomecánicas | |
| dc.publisher.program | Ingeniería Electrónica | |
| dc.publisher.school | Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones | |
| dc.rights | http://creativecommons.org/licenses/by/4.0/ | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0 | |
| dc.subject | Espacio tiempo-frecuencia | |
| dc.subject | MFCC | |
| dc.subject | Representación de la voz | |
| dc.subject | Tratamiento de señales | |
| dc.subject | Transformación de Fourier fraccionaria | |
| dc.subject | Verificación de locutores. | |
| dc.subject.keyword | Time-frequency space | |
| dc.subject.keyword | MFCC | |
| dc.subject.keyword | Speech representation | |
| dc.subject.keyword | Signal traitment | |
| dc.subject.keyword | Fractional Fourier Transform | |
| dc.subject.keyword | Speaker verification. | |
| dc.title | Análisis de un sistema para la verificación de locutores utilizando la transformación de Fourier de orden fraccional | |
| dc.title.english | Analysis of a speaker verification system, using fractional fourier transform® | |
| dc.type.coar | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
| dc.type.hasversion | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
| dspace.entity.type | Publication |
Archivos
Bloque original
1 - 3 de 3
Cargando...
- Nombre:
- Carta de autorización.pdf
- Tamaño:
- 1010.95 KB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- Nota de proyecto.pdf
- Tamaño:
- 745.89 KB
- Formato:
- Adobe Portable Document Format
