Desarrollo de aplicación de software para la detección de voces de niños de 3 a 5 años

Duran Ruiz, Diego Alejandro; Torres Castañeda, Jonathan Arley

Publicación:
Desarrollo de aplicación de software para la detección de voces de niños de 3 a 5 años

dc.contributor.advisor	Sepulveda Sepulveda, Franklin Alexander
dc.contributor.advisor	Suarez Brand, Janeth
dc.contributor.author	Duran Ruiz, Diego Alejandro
dc.contributor.author	Torres Castañeda, Jonathan Arley
dc.date.accessioned	2024-03-03T23:27:02Z
dc.date.available	2017
dc.date.available	2024-03-03T23:27:02Z
dc.date.created	2017
dc.date.issued	2017
dc.description.abstract	Este proyecto presenta y describe la implementación de una aplicación de software para la detección de voces de niños de 3 a 5 años. En el desarrollo se utilizaron diferentes bases de datos de audios, principalmente las señales de voz suministradas por la fonoaudióloga Janeth Suarez Brand. La base de datos está compuesta por 19 audios, cada uno con una duración promedio de 42 minutos. Cada audio corresponde a la conversación entre la fonoaudióloga y niños entre 3 a 5 años de edad. También, se recolectaron audios de diferentes personas y edades en nuestro entorno con el fin de realizar pruebas adicionales. La aplicación se desarrolló mediante el uso de herramientas de procesamiento de señales de voz y utilizando como herramienta de modelado a las Mezclas Gaussianas. Por medio de una interfaz gráfica amigable con el usuario se busca integrar los métodos utilizados. Basta con cargar el audio que se quiere segmentar, seleccionar la opción de segmentación y como resultado se generarán los intervalos de tiempo correspondientes a la voz del niño, al mismo tiempo que las distingue del ruido de fondo y de las voces de los adultos. El software ha sido desarrollado en Python 2.7.12. La segmentación de audios con voces infantiles podría llegar a usarse en Fonoaudiología para propósitos de análisis del habla durante la Primera Infancia
dc.description.abstractenglish	This project presents and describes the implementation of a software application for the detection of voices of children from 3 to 5 years. In the development, different databases of audios were used, mainly the voice signals supplied by the speech therapist Janeth Suarez Brand. The database is composed of 19 audios, each with an average duration of 42 minutes. They are composed by conversations between the speech therapist and children between 3 and 5 years of age. Additionally, audios from different people and ages were collected in order to perform additional test procedures. The application was developed through the use of voice signal processing tools and using Gaussian Mixtures as a modeling tool. Through a user-friendly graphical interface, the methods used are integrated. First, you need to load the audio you want to segment, select the segmentation option and as a result will generate the time intervals corresponding to the child's voice, while distinguishing them from the background noise and voices of adults. The software has been developed in Python 2.7.12. The segmentation of audios with children's voices could be used in Speech-Language Pathology for purposes of speech analysis during Early Childhood
dc.description.degreelevel	Pregrado
dc.description.degreename	Ingeniero Electrónico
dc.format.mimetype	application/pdf
dc.identifier.instname	Universidad Industrial de Santander
dc.identifier.reponame	Universidad Industrial de Santander
dc.identifier.repourl	https://noesis.uis.edu.co
dc.identifier.uri	https://noesis.uis.edu.co/handle/20.500.14071/37053
dc.language.iso	spa
dc.publisher	Universidad Industrial de Santander
dc.publisher.faculty	Facultad de Ingenierías Fisicomecánicas
dc.publisher.program	Ingeniería Electrónica
dc.publisher.school	Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
dc.rights	http://creativecommons.org/licenses/by/4.0/
dc.rights.accessrights	info:eu-repo/semantics/openAccess
dc.rights.creativecommons	Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.license	Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.uri	http://creativecommons.org/licenses/by-nc/4.0
dc.subject	Segmentación De Hablantes
dc.subject	Fonoaudiología
dc.subject	Mezclas Gaussianas.
dc.subject.keyword	Speaker Diarization
dc.subject.keyword	Speech-Language Pathology
dc.subject.keyword	Gaussian Mixtures.
dc.title	Desarrollo de aplicación de software para la detección de voces de niños de 3 a 5 años
dc.title.english	Development of software application for the detection of voices of children from three to five years
dc.type.coar	http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversion	http://purl.org/coar/resource_type/c_7a1f
dc.type.local	Tesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.type	Publication