Analisis de una herramienta de alineamiento texto-audio basada en segmentacion y ultrasonido para una base de datos del idioma castellano de la cuidad de bucaramanga
dc.contributor.advisor | Sepulveda Sepulveda, Franklin Alexander | |
dc.contributor.author | Castillo Solano, Margareth | |
dc.contributor.author | Rubio Toloza, Andres Felipe | |
dc.date.accessioned | 2023-04-06T03:39:06Z | |
dc.date.available | 2023 | |
dc.date.available | 2023-04-06T03:39:06Z | |
dc.date.created | 2019 | |
dc.date.issued | 2019 | |
dc.description.abstract | El alineamiento de texto en senales de voz busca establecer una corresponden- ˜ cia entre los tiempos en los que inician y terminan los sonidos de los fonemas y palabras con la respectiva representacion de la transcripci ´ on. Esta t ´ ecnica busca ´ crear un sistema automatico que permita la alineaci ´ on en tiempo de las se ´ nales ˜ de audio y el texto que corresponde a dicho audio. Sin embargo, el alineamiento de texto con voz genera una serie de inconvenientes, tales como, transcripciones imperfectas, retardos en intervalos de tiempo, gastos elevados en tiempo para el etiquetado manual de los datos, entre otros. De otra parte, es importante para la comunidad cient´ıfica analizar la dinamica de los articuladores y la relaci ´ on de esta ´ con el fenomeno ac ´ ustico, para lo cual es importante contar con conjuntos de datos ´ reales. Una de las formas de obtener estos datos reales es mediante ultrasonido. Este trabajo estudia el alineamiento entre texto-audio, incluyendo informacion arti- ´ culatoria proveniente de videos de ultrasonido para evaluar su contribucion en el ´ proceso de alineamiento mediante la herramienta HTK. A modo de aplicacion, esta ´ herramienta permite etiquetar conjuntos de datos de voz, de manera que se requiera una menor cantidad de tiempo en horas/hombre, al contar con una herramienta semi-automatica que realice esta tarea. Con el fin de evaluar el desempe ´ no, se lle- ˜ varan a cabo valoraciones de algunas medidas como calidad en las transcripciones ´ e intervalos de tiempo. Este proceso de alineamiento se lleva a cabo a traves de la ´ construccion de una base de datos con hablantes de edades entre 18-35 a ´ nos, to- ˜ dos habitantes de la ciudad de Bucaramanga, que incluye caracter´ısticas acusticas ´ e informacion articulatoria proveniente de videos de ultrasonido del trato vocal. | |
dc.description.abstractenglish | The alignment of text in voice signals seeks to establish a correspondence between the times at which the sounds of the phonemes and words begin and end with the respective representation of the transcription. This technique seeks to create an automatic system that allows the alignment in time of the audio signals and the text that corresponds to said audio. However, the alignment of text with voice generates a series of disadvantages, such as imperfect transcriptions, delays in time intervals, high expenses in time for the manual labeling of data, among others. On the other hand, it is important for the scientific community to analyze the dynamics of the articulators and their relationship with the acoustic phenomenon, for which it is important to have real data sets. One of the ways to obtain this real data is by ultrasound. This paper studies the alignment between text-audio, including articulatory information from ultrasound videos to evaluate its contribution in the alignment process using the HTK tool. As an application, this tool allows you to tag voice data sets, so that less time is required in hours / man, by having a semi-automatic tool that performs this task. In order to evaluate the performance, evaluations of some measures such as quality in transcripts and time intervals will be carried out. This alignment process is carried out through the construction of a database with speakers aged between 18-35 years, all inhabitants of the city of Bucaramanga, which includes acoustic characteristics and articulatory information from ultrasound videos of the treatment vocal. | |
dc.description.degreelevel | Pregrado | |
dc.description.degreename | Ingeniero Electrónico | |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad Industrial de Santander | |
dc.identifier.reponame | Universidad Industrial de Santander | |
dc.identifier.repourl | https://noesis.uis.edu.co | |
dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/13437 | |
dc.language.iso | spa | |
dc.publisher | Universidad Industrial de Santander | |
dc.publisher.faculty | Facultad de Ingenierías Fisicomecánicas | |
dc.publisher.program | Ingeniería Electrónica | |
dc.publisher.school | Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Alineamiento De Senales De Voz | |
dc.subject | Informaci ˜ On Ar- ´ Ticulatoria | |
dc.subject | Ultrasonido | |
dc.subject | Reconocimiento De Voz | |
dc.subject | Etiquetado De Datos. | |
dc.subject.keyword | Alignment Of Speech Signals | |
dc.subject.keyword | Articulatory Information | |
dc.subject.keyword | Ultrasound | |
dc.subject.keyword | Speech Recognition | |
dc.subject.keyword | Data Labeling | |
dc.title | Analisis de una herramienta de alineamiento texto-audio basada en segmentacion y ultrasonido para una base de datos del idioma castellano de la cuidad de bucaramanga | |
dc.title.english | Analysis of a text-audio alignment tool based on segmentation and ultrasound from a database of the spanish language at bucaramanga city ( | |
dc.type.coar | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
dc.type.hasversion | http://purl.org/coar/resource_type/c_7a1f | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
dspace.entity.type |
Files
Original bundle
1 - 3 of 3
No Thumbnail Available
- Name:
- Carta de autorización.pdf
- Size:
- 1.14 MB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Documento.pdf
- Size:
- 17.24 MB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Nota de proyecto.pdf
- Size:
- 922.38 KB
- Format:
- Adobe Portable Document Format