Publicación: Empleo de la transformada de Fourier fraccional para extraer características discriminantes en el reconocimiento de locutores
| dc.contributor.advisor | Torres Moreno, Yezid | |
| dc.contributor.author | Sandoval Villamizar, Idriss Tyler | |
| dc.date.accessioned | 2024-03-03T19:26:45Z | |
| dc.date.available | 2012 | |
| dc.date.available | 2024-03-03T19:26:45Z | |
| dc.date.created | 2012 | |
| dc.date.issued | 2012 | |
| dc.description.abstract | En este trabajo de investigación se presenta un estudio de las características discriminantes en el reconocimiento de locutores (o hablantes), las cuales están representadas en dominios mixtos tiempo-frecuencia donde se requiere identificar las particularidades que permiten reconocer a los hablantes empleando una nueva alternativa de representación de la señal de voz en el espacio de Fourier de orden fraccional. En la parte inicial se aborda lo concerniente al reconocimiento de locutores y sus generalidades. Posteriormente se introduce la forma integral de la transformada de Fourier fraccional (FRFT) y sus propiedades más relevantes, y se presentan los resultados experimentales del cálculo de la FRFT de un centenar de órdenes simultáneos en cada una de las señales de voz. Esta representación se realiza en seis (6) locutores, tres (3) hombres y tres (3) mujeres, quienes realizan la fonación de diferentes palabras de habla inglesa suministradas de una base de datos específica y con una frecuencia de muestreo de 16 kHz. A partir de una representación tiempo-orden en coordenadas rectangulares se obtiene una imagen de correlación en donde se extraen los parámetros relación señal a ruido SNR, relación altura de pico lóbulo lateral PSR, y la relación energía valor pico de correlación PCE, los cuales permiten evaluar las características métricas de la discriminación en los locutores. | |
| dc.description.abstractenglish | This research is aimed at studying the discriminating characteristics on the recognition, which are represented in mixed time-frequency domain where it is required to identify the characteristics that enable recognition of the speakers. Here we propose a new alternative representation of the voice signal in the fractional Fourier space, trying to identify a set of new features in advance cannot be evaluated with the use of standard Fourier Transform. The first part, deals with a fast review to recognition of speakers and general aspects. Subsequently we introduce the integral form of the fractional order Fourier transform (FRFT) and its most important properties, and we present experimental results of the FRFT calculus of a hundred orders simultaneous each of the voice signals. This representation is done in six (6) speakers, three (3) men and three (3) women who undertake the phonation of English of different words supplied from a specific database and a sampling frequency of 16 kHz. From time-order representation in rectangular coordinates we obtain a set of correlation image parameters. Are extracted signal to noise ratio SNR, Peak sidelobe ratio PSR and Peak to Correlation energy PCE parameters, this set is the metric to assess the discrimination characteristics for the speakers. | |
| dc.description.degreelevel | Maestría | |
| dc.description.degreename | Magíster en Ingeniería Electrónica | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | Universidad Industrial de Santander | |
| dc.identifier.reponame | Universidad Industrial de Santander | |
| dc.identifier.repourl | https://noesis.uis.edu.co | |
| dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/26497 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Industrial de Santander | |
| dc.publisher.faculty | Facultad de Ingenierías Fisicomecánicas | |
| dc.publisher.program | Maestría en Ingeniería Electrónica | |
| dc.publisher.school | Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones | |
| dc.rights | http://creativecommons.org/licenses/by/4.0/ | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0 | |
| dc.subject | FRFT | |
| dc.subject | Reconocimiento de hablantes | |
| dc.subject | Reconocimiento de voz | |
| dc.subject | Procesamiento de señal | |
| dc.subject.keyword | Fractional Fourier Transform | |
| dc.subject.keyword | Speaker recognition | |
| dc.subject.keyword | Voice recognition | |
| dc.subject.keyword | Signal processing | |
| dc.title | Empleo de la transformada de Fourier fraccional para extraer características discriminantes en el reconocimiento de locutores | |
| dc.title.english | Using the fractional fourier transform to extract discriminating features in speaker recognition | |
| dc.type.coar | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
| dc.type.hasversion | http://purl.org/coar/resource_type/c_bdcc | |
| dc.type.local | Tesis/Trabajo de grado - Monografía - Maestria | |
| dspace.entity.type | Publication |
Archivos
Bloque original
1 - 3 de 3
Cargando...
- Nombre:
- Carta de autorización.pdf
- Tamaño:
- 3.29 MB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- Documento.pdf
- Tamaño:
- 23.72 MB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- Nota de proyecto.pdf
- Tamaño:
- 2.63 MB
- Formato:
- Adobe Portable Document Format
