Publicación: Empleo de la transformada de Fourier fraccional para extraer características discriminantes en el reconocimiento de locutores
Portada
Citas bibliográficas
Gestores Bibliográficos
Código QR
Director
Autor corporativo
Recolector de datos
Otros/Desconocido
Director audiovisual
Editor
Fecha
Citación
Título de serie/ reporte/ volumen/ colección
Es Parte de
Resumen
En este trabajo de investigación se presenta un estudio de las características discriminantes en el reconocimiento de locutores (o hablantes), las cuales están representadas en dominios mixtos tiempo-frecuencia donde se requiere identificar las particularidades que permiten reconocer a los hablantes empleando una nueva alternativa de representación de la señal de voz en el espacio de Fourier de orden fraccional. En la parte inicial se aborda lo concerniente al reconocimiento de locutores y sus generalidades. Posteriormente se introduce la forma integral de la transformada de Fourier fraccional (FRFT) y sus propiedades más relevantes, y se presentan los resultados experimentales del cálculo de la FRFT de un centenar de órdenes simultáneos en cada una de las señales de voz. Esta representación se realiza en seis (6) locutores, tres (3) hombres y tres (3) mujeres, quienes realizan la fonación de diferentes palabras de habla inglesa suministradas de una base de datos específica y con una frecuencia de muestreo de 16 kHz. A partir de una representación tiempo-orden en coordenadas rectangulares se obtiene una imagen de correlación en donde se extraen los parámetros relación señal a ruido SNR, relación altura de pico lóbulo lateral PSR, y la relación energía valor pico de correlación PCE, los cuales permiten evaluar las características métricas de la discriminación en los locutores.

PDF
FLIP 
