Análisis de un sistema para la verificación de locutores utilizando la transformación de Fourier de orden fraccional
Cargando...
Fecha
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Industrial de Santander
Resumen
Dentro del ámbito del reconocimiento de personas por medio de características biométricas, la voz es sin duda la más natural de todas. Por otro lado, la implementación de aplicaciones que hacen uso del reconocimiento de voz, no necesita de infraestructura diferente, o por lo menos, no muy diferente a la que se tiene actualmente en telefonía y en sistemas de comunicación. La extracción de características de la voz representadas por los coeficientes cepstrales de Mel y los coeficientes LPC, o una combinación de estas dos representaciones, es una técnica que ha producido buenos resultados en el reconocimiento y verificación del habla y del hablante, pero la caracterización aún no satisface los objetivos de un sistema de verificación seguro. La transformación de Fourier fraccionaria (FrFT) es una generalización de la transformación de Fourier estándar (FT), donde la señal es representada en un espacio tiempo-frecuencia. En este trabajo se analiza el efecto de utilizar la transformada de Fourier de fraccionaria como método de la caracterización de la voz en un sistema de verificación de locutores dependiente del texto basado en Coeficientes Cepstrales en las Frecuencias de Mel (MFCC). Para ello, la señal de voz es representada en el dominio fraccionario, tiempo-frecuencia, teniéndose la posibilidad de encontrar un dominio fraccionario que mejore la representación del locutor. La factibilidad para la verificación de un individuo por su voz es abordada en este espacio de representación.