Logotipo del repositorio

Publicación:
Desarrollo de aplicación de software para la detección de voces de niños de 3 a 5 años

dc.contributor.advisorSepulveda Sepulveda, Franklin Alexander
dc.contributor.advisorSuarez Brand, Janeth
dc.contributor.authorDuran Ruiz, Diego Alejandro
dc.contributor.authorTorres Castañeda, Jonathan Arley
dc.date.accessioned2024-03-03T23:27:02Z
dc.date.available2017
dc.date.available2024-03-03T23:27:02Z
dc.date.created2017
dc.date.issued2017
dc.description.abstractEste proyecto presenta y describe la implementación de una aplicación de software para la detección de voces de niños de 3 a 5 años. En el desarrollo se utilizaron diferentes bases de datos de audios, principalmente las señales de voz suministradas por la fonoaudióloga Janeth Suarez Brand. La base de datos está compuesta por 19 audios, cada uno con una duración promedio de 42 minutos. Cada audio corresponde a la conversación entre la fonoaudióloga y niños entre 3 a 5 años de edad. También, se recolectaron audios de diferentes personas y edades en nuestro entorno con el fin de realizar pruebas adicionales. La aplicación se desarrolló mediante el uso de herramientas de procesamiento de señales de voz y utilizando como herramienta de modelado a las Mezclas Gaussianas. Por medio de una interfaz gráfica amigable con el usuario se busca integrar los métodos utilizados. Basta con cargar el audio que se quiere segmentar, seleccionar la opción de segmentación y como resultado se generarán los intervalos de tiempo correspondientes a la voz del niño, al mismo tiempo que las distingue del ruido de fondo y de las voces de los adultos. El software ha sido desarrollado en Python 2.7.12. La segmentación de audios con voces infantiles podría llegar a usarse en Fonoaudiología para propósitos de análisis del habla durante la Primera Infancia
dc.description.abstractenglishThis project presents and describes the implementation of a software application for the detection of voices of children from 3 to 5 years. In the development, different databases of audios were used, mainly the voice signals supplied by the speech therapist Janeth Suarez Brand. The database is composed of 19 audios, each with an average duration of 42 minutes. They are composed by conversations between the speech therapist and children between 3 and 5 years of age. Additionally, audios from different people and ages were collected in order to perform additional test procedures. The application was developed through the use of voice signal processing tools and using Gaussian Mixtures as a modeling tool. Through a user-friendly graphical interface, the methods used are integrated. First, you need to load the audio you want to segment, select the segmentation option and as a result will generate the time intervals corresponding to the child's voice, while distinguishing them from the background noise and voices of adults. The software has been developed in Python 2.7.12. The segmentation of audios with children's voices could be used in Speech-Language Pathology for purposes of speech analysis during Early Childhood
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Electrónico
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/37053
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programIngeniería Electrónica
dc.publisher.schoolEscuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
dc.rightshttp://creativecommons.org/licenses/by/4.0/
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0
dc.subjectSegmentación De Hablantes
dc.subjectFonoaudiología
dc.subjectMezclas Gaussianas.
dc.subject.keywordSpeaker Diarization
dc.subject.keywordSpeech-Language Pathology
dc.subject.keywordGaussian Mixtures.
dc.titleDesarrollo de aplicación de software para la detección de voces de niños de 3 a 5 años
dc.title.englishDevelopment of software application for the detection of voices of children from three to five years
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.typePublication

Archivos

Bloque original

Mostrando 1 - 3 de 3
Cargando...
Miniatura
Nombre:
Carta de autorización.pdf
Tamaño:
129.36 KB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Documento.pdf
Tamaño:
2.36 MB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Nota de proyecto.pdf
Tamaño:
59.39 KB
Formato:
Adobe Portable Document Format

VIGILADA MINEDUCACIÓN

Ordenanza No. 83 de 1.944 (junio 22)

Carácter académico: Universidad

Notificaciones judiciales: notjudiciales@uis.edu.co 

.

Código SNIES: 1204   Nit: 890.201.213-4

Línea Anticorrupción:  +57 (601) 562 9300 EXT: 3633

Línea transparente: +57 (607) 630 3031