Herramienta software para la generación automática de textos en inglés : un acercamiento a la generación de lenguaje natural
Cargando...
Fecha
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Industrial de Santander
Resumen
La redacción de textos en libros, tesis, artículos y otros documentos implica esfuerzo y tiempopara los autores, originando la necesidad de herramientas computacionales que colaboren oasistan esta labor. En Generación de Lenguaje Natural (GLN) se han desarrollado sistemascomo el KPML [33] y el MIAKT [1] y técnicas en procesos intermedios de generación textualcomo la teoría de la estructura retórica (RST) y los corpus lingiísticos, no sólo en la obtención automática de textos , sino en la presentación de información de modo compresible a laspersonas a partir de datos en formato de tablas, plantillas y entre otras formas. En este trabajo, el problema de la GLN es tratado de forma aproximada mediante la implementación de un prototipo computacional que produce textos para artículos técnicos en ingléscomo ayuda en la redacción de esta clase de reportes. Para ello, inicialmente se proporcionanlos conceptos fundamentales de la GLN, luego se presenta una revisión de las herramientasrelacionadas con el proceso, tomadas en la implementación del primer prototipo software queejecuta un procedimiento básico de obtención de nuevo texto. Los resultados de las pruebas a este programa determinaron la necesidad de construir uncorpus lingilístico con apoyo humano y el diseño de dos estrategias de producción de frasesuna basada en árboles de búsqueda y otra en cálculo de probabilidades, empleando la similitud entre oraciones, lo cuál fue llevado en conjunto en el desarrollo del sistema DISGEN.El resultado del trabajo se considera un primer aporte a la Generación de Lenguaje Naturalen el ámbito de la Universidad Industrial de Santander y deja abierta una referencia para larealización de proyectos relacionados a nivel local.