Análisis de un sistema para la verificación de locutores utilizando la transformación de Fourier de orden fraccional

Bertel Mendoza, David Daniel; Maldonado Orduz, Edgar Fernando

Publicación:
Análisis de un sistema para la verificación de locutores utilizando la transformación de Fourier de orden fraccional

dc.contributor.advisor	Torres Moreno, Yesid
dc.contributor.advisor	Barrero Pérez, Jaime Guillermo
dc.contributor.author	Bertel Mendoza, David Daniel
dc.contributor.author	Maldonado Orduz, Edgar Fernando
dc.date.accessioned	2024-03-03T18:42:52Z
dc.date.available	2011
dc.date.available	2024-03-03T18:42:52Z
dc.date.created	2011
dc.date.issued	2011
dc.description.abstract	Dentro del ámbito del reconocimiento de personas por medio de características biométricas, la voz es sin duda la más natural de todas. Por otro lado, la implementación de aplicaciones que hacen uso del reconocimiento de voz, no necesita de infraestructura diferente, o por lo menos, no muy diferente a la que se tiene actualmente en telefonía y en sistemas de comunicación. La extracción de características de la voz representadas por los coeficientes cepstrales de Mel y los coeficientes LPC, o una combinación de estas dos representaciones, es una técnica que ha producido buenos resultados en el reconocimiento y verificación del habla y del hablante, pero la caracterización aún no satisface los objetivos de un sistema de verificación seguro. La transformación de Fourier fraccionaria (FrFT) es una generalización de la transformación de Fourier estándar (FT), donde la señal es representada en un espacio tiempo-frecuencia. En este trabajo se analiza el efecto de utilizar la transformada de Fourier de fraccionaria como método de la caracterización de la voz en un sistema de verificación de locutores dependiente del texto basado en Coeficientes Cepstrales en las Frecuencias de Mel (MFCC). Para ello, la señal de voz es representada en el dominio fraccionario, tiempo-frecuencia, teniéndose la posibilidad de encontrar un dominio fraccionario que mejore la representación del locutor. La factibilidad para la verificación de un individuo por su voz es abordada en este espacio de representación.
dc.description.abstractenglish	In the field of pattern recognition speech is undoubtedly the most natural signal. Besides, speech recognition-based applications do not need different networks because actual communication systems provide a network for speech signal processing. The extraction of speech characteristics through Mel Frequency Cepstral Coefficients (MFCC) and Linear Predictive Coding (LPC) coefficients, or a combination of these representations, is a well-known technique that had produced good results in speech and speaker recognition and verification, but speech characterization does not satisfy secure verification system objectives yet. The Fractional Fourier Transform (FrFT) is a generalization of the Fourier Transform (FT), which characterizes a signal in a time-frequency space. In this work is analyzes the effect of use Fractional Fourier Transform as a speech parameterization method inside a text-dependent MFCC-based speaker verification system. For that, speech signal is represented in a time-frequency fractional domain, with the possibility of find a fractional domain where speech representation is better. The feasibility to verify a person through his voice is treated in this representation space.
dc.description.degreelevel	Pregrado
dc.description.degreename	Ingeniero Electrónico
dc.format.mimetype	application/pdf
dc.identifier.instname	Universidad Industrial de Santander
dc.identifier.reponame	Universidad Industrial de Santander
dc.identifier.repourl	https://noesis.uis.edu.co
dc.identifier.uri	https://noesis.uis.edu.co/handle/20.500.14071/25541
dc.language.iso	spa
dc.publisher	Universidad Industrial de Santander
dc.publisher.faculty	Facultad de Ingenierías Fisicomecánicas
dc.publisher.program	Ingeniería Electrónica
dc.publisher.school	Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
dc.rights	http://creativecommons.org/licenses/by/4.0/
dc.rights.accessrights	info:eu-repo/semantics/openAccess
dc.rights.creativecommons	Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.license	Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.uri	http://creativecommons.org/licenses/by-nc/4.0
dc.subject	Espacio tiempo-frecuencia
dc.subject	MFCC
dc.subject	Representación de la voz
dc.subject	Tratamiento de señales
dc.subject	Transformación de Fourier fraccionaria
dc.subject	Verificación de locutores.
dc.subject.keyword	Time-frequency space
dc.subject.keyword	MFCC
dc.subject.keyword	Speech representation
dc.subject.keyword	Signal traitment
dc.subject.keyword	Fractional Fourier Transform
dc.subject.keyword	Speaker verification.
dc.title	Análisis de un sistema para la verificación de locutores utilizando la transformación de Fourier de orden fraccional
dc.title.english	Analysis of a speaker verification system, using fractional fourier transform®
dc.type.coar	http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversion	http://purl.org/coar/resource_type/c_7a1f
dc.type.local	Tesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.type	Publication