Logotipo del repositorio

Publicación:
Algoritmo de deteccion de punto de inicio y fin para senales de voz

dc.contributor.advisorTorres Moreno, Yesid
dc.contributor.authorRueda Diaz, Euclides Alfonso
dc.date.accessioned2024-03-03T04:35:19Z
dc.date.available2004
dc.date.available2024-03-03T04:35:19Z
dc.date.created2004
dc.date.issued2004
dc.description.abstractEn la actualidad muchas aplicaciones basadas en la voz, son desarrolladas. En estas aplicaciones es necesario conocer donde empieza y donde termina la señal de voz con exactitud endpoint detection. En aplicaciones como la de reconocimiento de voz es necesario procesar la señal; la cual consiste de segmentos de voz, silencio y otros considerados como ruido. Se propone un algoritmo para la solución de este problema. Se construyó un algoritmo que cumple con los siguientes requerimientos: Robustez (funcione en ambientes adversos), Baja complejidad computacional (fácil implementación), rápido tiempo de respuesta y, sobre todo exactitud a la hora de encontrar los puntos de inicio y de fin de la voz. El algoritmo se diseño en tres etapas: La primera etapa viene asociada con el requerimiento de robustez, al ruido a través de la técnica de substracción espectral; en la segunda etapa se mejora la calidad de la señal de voz a través de filtros y la aplicación de otras técnicas; en la tercera y última etapa se encuentran los limites de la señal. Para lograrlo, lo primero que se hace es extraer los parámetros que sirven como discriminantes entre segmentos que tienen voz y los que no. Para esto se utilizan las características de energía y entropía de la señal. Finalmente, la señal es enviada a una máquina de decisión que se encarga de clasificar los segmentos que contienen voz y los que no. Durante todo el proceso se hace una evaluación de los resultados y se compara el obtenido con los reportados para las técnicas de la energía y de la entropía.
dc.description.abstractenglishAt the present time many applications of the speech are in development. In these applications it is necessary to know where begins and where finishes the signal of speech with exactitude or "endpoint detection". In applications as those of voice recognition, it is necessary to preprocess the signal. The voice signal is composed of speech signal, silence and noise segments. An algorithm to solve this problem is proposed. The algorithm looks for the following fulfills requirements: Robustness (it works in adverse noises), low complexity (easy computational implementation), fast time of response and mainly, accurate to find the beginning and end points. The proposed algorithm is designed in three stages: The first stage comes associate with the robustness requirement and use the spectral subtraction technique for noise reduction; in the second stage improve the quality and the SNR ratio of the signal of voice through the filters application and others techniques; in the third one or last stage, the algorithm looks for find the limits of speech. The algoritm extract different parameters to made the speech and non speech discrimation. For this characteristics the energy and entropy of the signal are used. Finally, the signal is sent to a decision machine to classify between speech and nonspeech. Throughout the algoritm an evaluation process is made for the results and then to compared them with the energy and the entropy algorithm.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero de Sistemas
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/16058
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programIngeniería de Sistemas
dc.publisher.schoolEscuela de Ingeniería de Sistemas e Informática
dc.rightshttp://creativecommons.org/licenses/by/4.0/
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0
dc.subjectVoz
dc.subjectDetección De Voz
dc.subjectDetección De Puntos De Inicio Y Fin
dc.subjectProcesamiento De La Voz.
dc.subject.keywordVoice
dc.subject.keywordSpeech Detection
dc.subject.keywordEndpoint Detection
dc.subject.keywordSpeech Processing.
dc.titleAlgoritmo de deteccion de punto de inicio y fin para senales de voz
dc.title.englishAlgorithm for endpoint detection in speech signals
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.typePublication

Archivos

Bloque original

Mostrando 1 - 2 de 2
Cargando...
Miniatura
Nombre:
Documento.pdf
Tamaño:
1.59 MB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Nota de proyecto.pdf
Tamaño:
175.49 KB
Formato:
Adobe Portable Document Format

VIGILADA MINEDUCACIÓN

Ordenanza No. 83 de 1.944 (junio 22)

Carácter académico: Universidad

Notificaciones judiciales: notjudiciales@uis.edu.co 

.

Código SNIES: 1204   Nit: 890.201.213-4

Línea Anticorrupción:  +57 (601) 562 9300 EXT: 3633

Línea transparente: +57 (607) 630 3031