Publicación: Desarrollo de aplicación de software para la detección de voces de niños de 3 a 5 años
| dc.contributor.advisor | Sepulveda Sepulveda, Franklin Alexander | |
| dc.contributor.advisor | Suarez Brand, Janeth | |
| dc.contributor.author | Duran Ruiz, Diego Alejandro | |
| dc.contributor.author | Torres Castañeda, Jonathan Arley | |
| dc.date.accessioned | 2024-03-03T23:27:02Z | |
| dc.date.available | 2017 | |
| dc.date.available | 2024-03-03T23:27:02Z | |
| dc.date.created | 2017 | |
| dc.date.issued | 2017 | |
| dc.description.abstract | Este proyecto presenta y describe la implementación de una aplicación de software para la detección de voces de niños de 3 a 5 años. En el desarrollo se utilizaron diferentes bases de datos de audios, principalmente las señales de voz suministradas por la fonoaudióloga Janeth Suarez Brand. La base de datos está compuesta por 19 audios, cada uno con una duración promedio de 42 minutos. Cada audio corresponde a la conversación entre la fonoaudióloga y niños entre 3 a 5 años de edad. También, se recolectaron audios de diferentes personas y edades en nuestro entorno con el fin de realizar pruebas adicionales. La aplicación se desarrolló mediante el uso de herramientas de procesamiento de señales de voz y utilizando como herramienta de modelado a las Mezclas Gaussianas. Por medio de una interfaz gráfica amigable con el usuario se busca integrar los métodos utilizados. Basta con cargar el audio que se quiere segmentar, seleccionar la opción de segmentación y como resultado se generarán los intervalos de tiempo correspondientes a la voz del niño, al mismo tiempo que las distingue del ruido de fondo y de las voces de los adultos. El software ha sido desarrollado en Python 2.7.12. La segmentación de audios con voces infantiles podría llegar a usarse en Fonoaudiología para propósitos de análisis del habla durante la Primera Infancia | |
| dc.description.abstractenglish | This project presents and describes the implementation of a software application for the detection of voices of children from 3 to 5 years. In the development, different databases of audios were used, mainly the voice signals supplied by the speech therapist Janeth Suarez Brand. The database is composed of 19 audios, each with an average duration of 42 minutes. They are composed by conversations between the speech therapist and children between 3 and 5 years of age. Additionally, audios from different people and ages were collected in order to perform additional test procedures. The application was developed through the use of voice signal processing tools and using Gaussian Mixtures as a modeling tool. Through a user-friendly graphical interface, the methods used are integrated. First, you need to load the audio you want to segment, select the segmentation option and as a result will generate the time intervals corresponding to the child's voice, while distinguishing them from the background noise and voices of adults. The software has been developed in Python 2.7.12. The segmentation of audios with children's voices could be used in Speech-Language Pathology for purposes of speech analysis during Early Childhood | |
| dc.description.degreelevel | Pregrado | |
| dc.description.degreename | Ingeniero Electrónico | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | Universidad Industrial de Santander | |
| dc.identifier.reponame | Universidad Industrial de Santander | |
| dc.identifier.repourl | https://noesis.uis.edu.co | |
| dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/37053 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Industrial de Santander | |
| dc.publisher.faculty | Facultad de Ingenierías Fisicomecánicas | |
| dc.publisher.program | Ingeniería Electrónica | |
| dc.publisher.school | Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones | |
| dc.rights | http://creativecommons.org/licenses/by/4.0/ | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0 | |
| dc.subject | Segmentación De Hablantes | |
| dc.subject | Fonoaudiología | |
| dc.subject | Mezclas Gaussianas. | |
| dc.subject.keyword | Speaker Diarization | |
| dc.subject.keyword | Speech-Language Pathology | |
| dc.subject.keyword | Gaussian Mixtures. | |
| dc.title | Desarrollo de aplicación de software para la detección de voces de niños de 3 a 5 años | |
| dc.title.english | Development of software application for the detection of voices of children from three to five years | |
| dc.type.coar | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
| dc.type.hasversion | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
| dspace.entity.type | Publication |
Archivos
Bloque original
1 - 3 de 3
Cargando...
- Nombre:
- Carta de autorización.pdf
- Tamaño:
- 129.36 KB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- Nota de proyecto.pdf
- Tamaño:
- 59.39 KB
- Formato:
- Adobe Portable Document Format
