Publicación: Algoritmo de deteccion de punto de inicio y fin para senales de voz
| dc.contributor.advisor | Torres Moreno, Yesid | |
| dc.contributor.author | Rueda Diaz, Euclides Alfonso | |
| dc.date.accessioned | 2024-03-03T04:35:19Z | |
| dc.date.available | 2004 | |
| dc.date.available | 2024-03-03T04:35:19Z | |
| dc.date.created | 2004 | |
| dc.date.issued | 2004 | |
| dc.description.abstract | En la actualidad muchas aplicaciones basadas en la voz, son desarrolladas. En estas aplicaciones es necesario conocer donde empieza y donde termina la señal de voz con exactitud endpoint detection. En aplicaciones como la de reconocimiento de voz es necesario procesar la señal; la cual consiste de segmentos de voz, silencio y otros considerados como ruido. Se propone un algoritmo para la solución de este problema. Se construyó un algoritmo que cumple con los siguientes requerimientos: Robustez (funcione en ambientes adversos), Baja complejidad computacional (fácil implementación), rápido tiempo de respuesta y, sobre todo exactitud a la hora de encontrar los puntos de inicio y de fin de la voz. El algoritmo se diseño en tres etapas: La primera etapa viene asociada con el requerimiento de robustez, al ruido a través de la técnica de substracción espectral; en la segunda etapa se mejora la calidad de la señal de voz a través de filtros y la aplicación de otras técnicas; en la tercera y última etapa se encuentran los limites de la señal. Para lograrlo, lo primero que se hace es extraer los parámetros que sirven como discriminantes entre segmentos que tienen voz y los que no. Para esto se utilizan las características de energía y entropía de la señal. Finalmente, la señal es enviada a una máquina de decisión que se encarga de clasificar los segmentos que contienen voz y los que no. Durante todo el proceso se hace una evaluación de los resultados y se compara el obtenido con los reportados para las técnicas de la energía y de la entropía. | |
| dc.description.abstractenglish | At the present time many applications of the speech are in development. In these applications it is necessary to know where begins and where finishes the signal of speech with exactitude or "endpoint detection". In applications as those of voice recognition, it is necessary to preprocess the signal. The voice signal is composed of speech signal, silence and noise segments. An algorithm to solve this problem is proposed. The algorithm looks for the following fulfills requirements: Robustness (it works in adverse noises), low complexity (easy computational implementation), fast time of response and mainly, accurate to find the beginning and end points. The proposed algorithm is designed in three stages: The first stage comes associate with the robustness requirement and use the spectral subtraction technique for noise reduction; in the second stage improve the quality and the SNR ratio of the signal of voice through the filters application and others techniques; in the third one or last stage, the algorithm looks for find the limits of speech. The algoritm extract different parameters to made the speech and non speech discrimation. For this characteristics the energy and entropy of the signal are used. Finally, the signal is sent to a decision machine to classify between speech and nonspeech. Throughout the algoritm an evaluation process is made for the results and then to compared them with the energy and the entropy algorithm. | |
| dc.description.degreelevel | Pregrado | |
| dc.description.degreename | Ingeniero de Sistemas | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | Universidad Industrial de Santander | |
| dc.identifier.reponame | Universidad Industrial de Santander | |
| dc.identifier.repourl | https://noesis.uis.edu.co | |
| dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/16058 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Industrial de Santander | |
| dc.publisher.faculty | Facultad de Ingenierías Fisicomecánicas | |
| dc.publisher.program | Ingeniería de Sistemas | |
| dc.publisher.school | Escuela de Ingeniería de Sistemas e Informática | |
| dc.rights | http://creativecommons.org/licenses/by/4.0/ | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0 | |
| dc.subject | Voz | |
| dc.subject | Detección De Voz | |
| dc.subject | Detección De Puntos De Inicio Y Fin | |
| dc.subject | Procesamiento De La Voz. | |
| dc.subject.keyword | Voice | |
| dc.subject.keyword | Speech Detection | |
| dc.subject.keyword | Endpoint Detection | |
| dc.subject.keyword | Speech Processing. | |
| dc.title | Algoritmo de deteccion de punto de inicio y fin para senales de voz | |
| dc.title.english | Algorithm for endpoint detection in speech signals | |
| dc.type.coar | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
| dc.type.hasversion | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
| dspace.entity.type | Publication |
