Logotipo del repositorio

Publicación:
Empleo de la transformada de Fourier fraccional para extraer características discriminantes en el reconocimiento de locutores

dc.contributor.advisorTorres Moreno, Yezid
dc.contributor.authorSandoval Villamizar, Idriss Tyler
dc.date.accessioned2024-03-03T19:26:45Z
dc.date.available2012
dc.date.available2024-03-03T19:26:45Z
dc.date.created2012
dc.date.issued2012
dc.description.abstractEn este trabajo de investigación se presenta un estudio de las características discriminantes en el reconocimiento de locutores (o hablantes), las cuales están representadas en dominios mixtos tiempo-frecuencia donde se requiere identificar las particularidades que permiten reconocer a los hablantes empleando una nueva alternativa de representación de la señal de voz en el espacio de Fourier de orden fraccional. En la parte inicial se aborda lo concerniente al reconocimiento de locutores y sus generalidades. Posteriormente se introduce la forma integral de la transformada de Fourier fraccional (FRFT) y sus propiedades más relevantes, y se presentan los resultados experimentales del cálculo de la FRFT de un centenar de órdenes simultáneos en cada una de las señales de voz. Esta representación se realiza en seis (6) locutores, tres (3) hombres y tres (3) mujeres, quienes realizan la fonación de diferentes palabras de habla inglesa suministradas de una base de datos específica y con una frecuencia de muestreo de 16 kHz. A partir de una representación tiempo-orden en coordenadas rectangulares se obtiene una imagen de correlación en donde se extraen los parámetros relación señal a ruido SNR, relación altura de pico lóbulo lateral PSR, y la relación energía valor pico de correlación PCE, los cuales permiten evaluar las características métricas de la discriminación en los locutores.
dc.description.abstractenglishThis research is aimed at studying the discriminating characteristics on the recognition, which are represented in mixed time-frequency domain where it is required to identify the characteristics that enable recognition of the speakers. Here we propose a new alternative representation of the voice signal in the fractional Fourier space, trying to identify a set of new features in advance cannot be evaluated with the use of standard Fourier Transform. The first part, deals with a fast review to recognition of speakers and general aspects. Subsequently we introduce the integral form of the fractional order Fourier transform (FRFT) and its most important properties, and we present experimental results of the FRFT calculus of a hundred orders simultaneous each of the voice signals. This representation is done in six (6) speakers, three (3) men and three (3) women who undertake the phonation of English of different words supplied from a specific database and a sampling frequency of 16 kHz. From time-order representation in rectangular coordinates we obtain a set of correlation image parameters. Are extracted signal to noise ratio SNR, Peak sidelobe ratio PSR and Peak to Correlation energy PCE parameters, this set is the metric to assess the discrimination characteristics for the speakers.
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Ingeniería Electrónica
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/26497
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programMaestría en Ingeniería Electrónica
dc.publisher.schoolEscuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
dc.rightshttp://creativecommons.org/licenses/by/4.0/
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0
dc.subjectFRFT
dc.subjectReconocimiento de hablantes
dc.subjectReconocimiento de voz
dc.subjectProcesamiento de señal
dc.subject.keywordFractional Fourier Transform
dc.subject.keywordSpeaker recognition
dc.subject.keywordVoice recognition
dc.subject.keywordSignal processing
dc.titleEmpleo de la transformada de Fourier fraccional para extraer características discriminantes en el reconocimiento de locutores
dc.title.englishUsing the fractional fourier transform to extract discriminating features in speaker recognition
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_bdcc
dc.type.localTesis/Trabajo de grado - Monografía - Maestria
dspace.entity.typePublication

Archivos

Bloque original

Mostrando 1 - 3 de 3
Cargando...
Miniatura
Nombre:
Carta de autorización.pdf
Tamaño:
3.29 MB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Documento.pdf
Tamaño:
23.72 MB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Nota de proyecto.pdf
Tamaño:
2.63 MB
Formato:
Adobe Portable Document Format

VIGILADA MINEDUCACIÓN

Ordenanza No. 83 de 1.944 (junio 22)

Carácter académico: Universidad

Notificaciones judiciales: notjudiciales@uis.edu.co 

.

Código SNIES: 1204   Nit: 890.201.213-4

Línea Anticorrupción:  +57 (601) 562 9300 EXT: 3633

Línea transparente: +57 (607) 630 3031