Analisis de una herramienta de alineamiento texto-audio basada en segmentacion y ultrasonido para una base de datos del idioma castellano de la cuidad de bucaramanga
No Thumbnail Available
Date
2019
Evaluators
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Industrial de Santander
Abstract
El alineamiento de texto en senales de voz busca establecer una corresponden- ˜ cia entre los tiempos en los que inician y terminan los sonidos de los fonemas y palabras con la respectiva representacion de la transcripci ´ on. Esta t ´ ecnica busca ´ crear un sistema automatico que permita la alineaci ´ on en tiempo de las se ´ nales ˜ de audio y el texto que corresponde a dicho audio. Sin embargo, el alineamiento de texto con voz genera una serie de inconvenientes, tales como, transcripciones imperfectas, retardos en intervalos de tiempo, gastos elevados en tiempo para el etiquetado manual de los datos, entre otros. De otra parte, es importante para la comunidad cient´ıfica analizar la dinamica de los articuladores y la relaci ´ on de esta ´ con el fenomeno ac ´ ustico, para lo cual es importante contar con conjuntos de datos ´ reales. Una de las formas de obtener estos datos reales es mediante ultrasonido. Este trabajo estudia el alineamiento entre texto-audio, incluyendo informacion arti- ´ culatoria proveniente de videos de ultrasonido para evaluar su contribucion en el ´ proceso de alineamiento mediante la herramienta HTK. A modo de aplicacion, esta ´ herramienta permite etiquetar conjuntos de datos de voz, de manera que se requiera una menor cantidad de tiempo en horas/hombre, al contar con una herramienta semi-automatica que realice esta tarea. Con el fin de evaluar el desempe ´ no, se lle- ˜ varan a cabo valoraciones de algunas medidas como calidad en las transcripciones ´ e intervalos de tiempo. Este proceso de alineamiento se lleva a cabo a traves de la ´ construccion de una base de datos con hablantes de edades entre 18-35 a ´ nos, to- ˜ dos habitantes de la ciudad de Bucaramanga, que incluye caracter´ısticas acusticas ´ e informacion articulatoria proveniente de videos de ultrasonido del trato vocal.
Description
Keywords
Alineamiento De Senales De Voz, Informaci ˜ On Ar- ´ Ticulatoria, Ultrasonido, Reconocimiento De Voz, Etiquetado De Datos.