Algoritmo de deteccion de punto de inicio y fin para senales de voz

Rueda Diaz, Euclides Alfonso

Publicación:
Algoritmo de deteccion de punto de inicio y fin para senales de voz

dc.contributor.advisor	Torres Moreno, Yesid
dc.contributor.author	Rueda Diaz, Euclides Alfonso
dc.date.accessioned	2024-03-03T04:35:19Z
dc.date.available	2004
dc.date.available	2024-03-03T04:35:19Z
dc.date.created	2004
dc.date.issued	2004
dc.description.abstract	En la actualidad muchas aplicaciones basadas en la voz, son desarrolladas. En estas aplicaciones es necesario conocer donde empieza y donde termina la señal de voz con exactitud endpoint detection. En aplicaciones como la de reconocimiento de voz es necesario procesar la señal; la cual consiste de segmentos de voz, silencio y otros considerados como ruido. Se propone un algoritmo para la solución de este problema. Se construyó un algoritmo que cumple con los siguientes requerimientos: Robustez (funcione en ambientes adversos), Baja complejidad computacional (fácil implementación), rápido tiempo de respuesta y, sobre todo exactitud a la hora de encontrar los puntos de inicio y de fin de la voz. El algoritmo se diseño en tres etapas: La primera etapa viene asociada con el requerimiento de robustez, al ruido a través de la técnica de substracción espectral; en la segunda etapa se mejora la calidad de la señal de voz a través de filtros y la aplicación de otras técnicas; en la tercera y última etapa se encuentran los limites de la señal. Para lograrlo, lo primero que se hace es extraer los parámetros que sirven como discriminantes entre segmentos que tienen voz y los que no. Para esto se utilizan las características de energía y entropía de la señal. Finalmente, la señal es enviada a una máquina de decisión que se encarga de clasificar los segmentos que contienen voz y los que no. Durante todo el proceso se hace una evaluación de los resultados y se compara el obtenido con los reportados para las técnicas de la energía y de la entropía.
dc.description.abstractenglish	At the present time many applications of the speech are in development. In these applications it is necessary to know where begins and where finishes the signal of speech with exactitude or "endpoint detection". In applications as those of voice recognition, it is necessary to preprocess the signal. The voice signal is composed of speech signal, silence and noise segments. An algorithm to solve this problem is proposed. The algorithm looks for the following fulfills requirements: Robustness (it works in adverse noises), low complexity (easy computational implementation), fast time of response and mainly, accurate to find the beginning and end points. The proposed algorithm is designed in three stages: The first stage comes associate with the robustness requirement and use the spectral subtraction technique for noise reduction; in the second stage improve the quality and the SNR ratio of the signal of voice through the filters application and others techniques; in the third one or last stage, the algorithm looks for find the limits of speech. The algoritm extract different parameters to made the speech and non speech discrimation. For this characteristics the energy and entropy of the signal are used. Finally, the signal is sent to a decision machine to classify between speech and nonspeech. Throughout the algoritm an evaluation process is made for the results and then to compared them with the energy and the entropy algorithm.
dc.description.degreelevel	Pregrado
dc.description.degreename	Ingeniero de Sistemas
dc.format.mimetype	application/pdf
dc.identifier.instname	Universidad Industrial de Santander
dc.identifier.reponame	Universidad Industrial de Santander
dc.identifier.repourl	https://noesis.uis.edu.co
dc.identifier.uri	https://noesis.uis.edu.co/handle/20.500.14071/16058
dc.language.iso	spa
dc.publisher	Universidad Industrial de Santander
dc.publisher.faculty	Facultad de Ingenierías Fisicomecánicas
dc.publisher.program	Ingeniería de Sistemas
dc.publisher.school	Escuela de Ingeniería de Sistemas e Informática
dc.rights	http://creativecommons.org/licenses/by/4.0/
dc.rights.accessrights	info:eu-repo/semantics/openAccess
dc.rights.creativecommons	Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.license	Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.uri	http://creativecommons.org/licenses/by-nc/4.0
dc.subject	Voz
dc.subject	Detección De Voz
dc.subject	Detección De Puntos De Inicio Y Fin
dc.subject	Procesamiento De La Voz.
dc.subject.keyword	Voice
dc.subject.keyword	Speech Detection
dc.subject.keyword	Endpoint Detection
dc.subject.keyword	Speech Processing.
dc.title	Algoritmo de deteccion de punto de inicio y fin para senales de voz
dc.title.english	Algorithm for endpoint detection in speech signals
dc.type.coar	http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversion	http://purl.org/coar/resource_type/c_7a1f
dc.type.local	Tesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.type	Publication

Archivos

Bloque original

Mostrando 1 - 2 de 2

Nombre:: Documento.pdf
Tamaño:: 1.59 MB
Formato:: Adobe Portable Document Format

Descargar

Nombre:: Nota de proyecto.pdf
Tamaño:: 175.49 KB
Formato:: Adobe Portable Document Format

Descargar

Colecciones

Ingeniería de Sistemas

Publicación: Algoritmo de deteccion de punto de inicio y fin para senales de voz

Archivos

Bloque original

Colecciones

Publicación:
Algoritmo de deteccion de punto de inicio y fin para senales de voz