Analisis de una herramienta de alineamiento texto-audio basada en segmentacion y ultrasonido para una base de datos del idioma castellano de la cuidad de bucaramanga

dc.contributor.advisorSepulveda Sepulveda, Franklin Alexander
dc.contributor.authorCastillo Solano, Margareth
dc.contributor.authorRubio Toloza, Andres Felipe
dc.date.accessioned2023-04-06T03:39:06Z
dc.date.available2023
dc.date.available2023-04-06T03:39:06Z
dc.date.created2019
dc.date.issued2019
dc.description.abstractEl alineamiento de texto en senales de voz busca establecer una corresponden- ˜ cia entre los tiempos en los que inician y terminan los sonidos de los fonemas y palabras con la respectiva representacion de la transcripci ´ on. Esta t ´ ecnica busca ´ crear un sistema automatico que permita la alineaci ´ on en tiempo de las se ´ nales ˜ de audio y el texto que corresponde a dicho audio. Sin embargo, el alineamiento de texto con voz genera una serie de inconvenientes, tales como, transcripciones imperfectas, retardos en intervalos de tiempo, gastos elevados en tiempo para el etiquetado manual de los datos, entre otros. De otra parte, es importante para la comunidad cient´ıfica analizar la dinamica de los articuladores y la relaci ´ on de esta ´ con el fenomeno ac ´ ustico, para lo cual es importante contar con conjuntos de datos ´ reales. Una de las formas de obtener estos datos reales es mediante ultrasonido. Este trabajo estudia el alineamiento entre texto-audio, incluyendo informacion arti- ´ culatoria proveniente de videos de ultrasonido para evaluar su contribucion en el ´ proceso de alineamiento mediante la herramienta HTK. A modo de aplicacion, esta ´ herramienta permite etiquetar conjuntos de datos de voz, de manera que se requiera una menor cantidad de tiempo en horas/hombre, al contar con una herramienta semi-automatica que realice esta tarea. Con el fin de evaluar el desempe ´ no, se lle- ˜ varan a cabo valoraciones de algunas medidas como calidad en las transcripciones ´ e intervalos de tiempo. Este proceso de alineamiento se lleva a cabo a traves de la ´ construccion de una base de datos con hablantes de edades entre 18-35 a ´ nos, to- ˜ dos habitantes de la ciudad de Bucaramanga, que incluye caracter´ısticas acusticas ´ e informacion articulatoria proveniente de videos de ultrasonido del trato vocal.
dc.description.abstractenglishThe alignment of text in voice signals seeks to establish a correspondence between the times at which the sounds of the phonemes and words begin and end with the respective representation of the transcription. This technique seeks to create an automatic system that allows the alignment in time of the audio signals and the text that corresponds to said audio. However, the alignment of text with voice generates a series of disadvantages, such as imperfect transcriptions, delays in time intervals, high expenses in time for the manual labeling of data, among others. On the other hand, it is important for the scientific community to analyze the dynamics of the articulators and their relationship with the acoustic phenomenon, for which it is important to have real data sets. One of the ways to obtain this real data is by ultrasound. This paper studies the alignment between text-audio, including articulatory information from ultrasound videos to evaluate its contribution in the alignment process using the HTK tool. As an application, this tool allows you to tag voice data sets, so that less time is required in hours / man, by having a semi-automatic tool that performs this task. In order to evaluate the performance, evaluations of some measures such as quality in transcripts and time intervals will be carried out. This alignment process is carried out through the construction of a database with speakers aged between 18-35 years, all inhabitants of the city of Bucaramanga, which includes acoustic characteristics and articulatory information from ultrasound videos of the treatment vocal.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Electrónico
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/13437
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programIngeniería Electrónica
dc.publisher.schoolEscuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectAlineamiento De Senales De Voz
dc.subjectInformaci ˜ On Ar- ´ Ticulatoria
dc.subjectUltrasonido
dc.subjectReconocimiento De Voz
dc.subjectEtiquetado De Datos.
dc.subject.keywordAlignment Of Speech Signals
dc.subject.keywordArticulatory Information
dc.subject.keywordUltrasound
dc.subject.keywordSpeech Recognition
dc.subject.keywordData Labeling
dc.titleAnalisis de una herramienta de alineamiento texto-audio basada en segmentacion y ultrasonido para una base de datos del idioma castellano de la cuidad de bucaramanga
dc.title.englishAnalysis of a text-audio alignment tool based on segmentation and ultrasound from a database of the spanish language at bucaramanga city (
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.type
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
1.14 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
17.24 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
922.38 KB
Format:
Adobe Portable Document Format