Logotipo del repositorio

Publicación:
Análisis de un sistema para la verificación de locutores utilizando la transformación de Fourier de orden fraccional

dc.contributor.advisorTorres Moreno, Yesid
dc.contributor.advisorBarrero Pérez, Jaime Guillermo
dc.contributor.authorBertel Mendoza, David Daniel
dc.contributor.authorMaldonado Orduz, Edgar Fernando
dc.date.accessioned2024-03-03T18:42:52Z
dc.date.available2011
dc.date.available2024-03-03T18:42:52Z
dc.date.created2011
dc.date.issued2011
dc.description.abstractDentro del ámbito del reconocimiento de personas por medio de características biométricas, la voz es sin duda la más natural de todas. Por otro lado, la implementación de aplicaciones que hacen uso del reconocimiento de voz, no necesita de infraestructura diferente, o por lo menos, no muy diferente a la que se tiene actualmente en telefonía y en sistemas de comunicación. La extracción de características de la voz representadas por los coeficientes cepstrales de Mel y los coeficientes LPC, o una combinación de estas dos representaciones, es una técnica que ha producido buenos resultados en el reconocimiento y verificación del habla y del hablante, pero la caracterización aún no satisface los objetivos de un sistema de verificación seguro. La transformación de Fourier fraccionaria (FrFT) es una generalización de la transformación de Fourier estándar (FT), donde la señal es representada en un espacio tiempo-frecuencia. En este trabajo se analiza el efecto de utilizar la transformada de Fourier de fraccionaria como método de la caracterización de la voz en un sistema de verificación de locutores dependiente del texto basado en Coeficientes Cepstrales en las Frecuencias de Mel (MFCC). Para ello, la señal de voz es representada en el dominio fraccionario, tiempo-frecuencia, teniéndose la posibilidad de encontrar un dominio fraccionario que mejore la representación del locutor. La factibilidad para la verificación de un individuo por su voz es abordada en este espacio de representación.
dc.description.abstractenglishIn the field of pattern recognition speech is undoubtedly the most natural signal. Besides, speech recognition-based applications do not need different networks because actual communication systems provide a network for speech signal processing. The extraction of speech characteristics through Mel Frequency Cepstral Coefficients (MFCC) and Linear Predictive Coding (LPC) coefficients, or a combination of these representations, is a well-known technique that had produced good results in speech and speaker recognition and verification, but speech characterization does not satisfy secure verification system objectives yet. The Fractional Fourier Transform (FrFT) is a generalization of the Fourier Transform (FT), which characterizes a signal in a time-frequency space. In this work is analyzes the effect of use Fractional Fourier Transform as a speech parameterization method inside a text-dependent MFCC-based speaker verification system. For that, speech signal is represented in a time-frequency fractional domain, with the possibility of find a fractional domain where speech representation is better. The feasibility to verify a person through his voice is treated in this representation space.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Electrónico
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/25541
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programIngeniería Electrónica
dc.publisher.schoolEscuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
dc.rightshttp://creativecommons.org/licenses/by/4.0/
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0
dc.subjectEspacio tiempo-frecuencia
dc.subjectMFCC
dc.subjectRepresentación de la voz
dc.subjectTratamiento de señales
dc.subjectTransformación de Fourier fraccionaria
dc.subjectVerificación de locutores.
dc.subject.keywordTime-frequency space
dc.subject.keywordMFCC
dc.subject.keywordSpeech representation
dc.subject.keywordSignal traitment
dc.subject.keywordFractional Fourier Transform
dc.subject.keywordSpeaker verification.
dc.titleAnálisis de un sistema para la verificación de locutores utilizando la transformación de Fourier de orden fraccional
dc.title.englishAnalysis of a speaker verification system, using fractional fourier transform®
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.typePublication

Archivos

Bloque original

Mostrando 1 - 3 de 3
Cargando...
Miniatura
Nombre:
Carta de autorización.pdf
Tamaño:
1010.95 KB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Documento.pdf
Tamaño:
1.96 MB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Nota de proyecto.pdf
Tamaño:
745.89 KB
Formato:
Adobe Portable Document Format

VIGILADA MINEDUCACIÓN

Ordenanza No. 83 de 1.944 (junio 22)

Carácter académico: Universidad

Notificaciones judiciales: notjudiciales@uis.edu.co 

.

Código SNIES: 1204   Nit: 890.201.213-4

Línea Anticorrupción:  +57 (601) 562 9300 EXT: 3633

Línea transparente: +57 (607) 630 3031