Publicación: Herramienta software para la generación automática de textos en inglés : un acercamiento a la generación de lenguaje natural
| dc.contributor.advisor | Arguello Fuentes, Henry | |
| dc.contributor.author | Rojas Jiménez, Clayderman Josué | |
| dc.contributor.author | Garcia Rueda, William Leonardo | |
| dc.date.accessioned | 2024-03-03T16:33:58Z | |
| dc.date.available | 2007 | |
| dc.date.available | 2024-03-03T16:33:58Z | |
| dc.date.created | 2007 | |
| dc.date.issued | 2007 | |
| dc.description.abstract | La redacción de textos en libros, tesis, artículos y otros documentos implica esfuerzo y tiempopara los autores, originando la necesidad de herramientas computacionales que colaboren oasistan esta labor. En Generación de Lenguaje Natural (GLN) se han desarrollado sistemascomo el KPML [33] y el MIAKT [1] y técnicas en procesos intermedios de generación textualcomo la teoría de la estructura retórica (RST) y los corpus lingiísticos, no sólo en la obtención automática de textos , sino en la presentación de información de modo compresible a laspersonas a partir de datos en formato de tablas, plantillas y entre otras formas. En este trabajo, el problema de la GLN es tratado de forma aproximada mediante la implementación de un prototipo computacional que produce textos para artículos técnicos en ingléscomo ayuda en la redacción de esta clase de reportes. Para ello, inicialmente se proporcionanlos conceptos fundamentales de la GLN, luego se presenta una revisión de las herramientasrelacionadas con el proceso, tomadas en la implementación del primer prototipo software queejecuta un procedimiento básico de obtención de nuevo texto. Los resultados de las pruebas a este programa determinaron la necesidad de construir uncorpus lingilístico con apoyo humano y el diseño de dos estrategias de producción de frasesuna basada en árboles de búsqueda y otra en cálculo de probabilidades, empleando la similitud entre oraciones, lo cuál fue llevado en conjunto en el desarrollo del sistema DISGEN.El resultado del trabajo se considera un primer aporte a la Generación de Lenguaje Naturalen el ámbito de la Universidad Industrial de Santander y deja abierta una referencia para larealización de proyectos relacionados a nivel local. | |
| dc.description.abstractenglish | Drafting texts in books, thesis, papers and other documents represents effort and time toauthors, making necessary computational systems for work or attend that. In Natural Language Generation (NLG), has been developed systems such as KPML [33] and MIAKT [1],and techniques for generation intermediate process such as rethorical structure theory (RST)and linguistics corpus, not only for automatic texts obtaining, also in data presentation in aform understandable for people from data in tables, templates and other forms. In this work, NLG problem is treated in an aproximated way by implementing a prototype computer that produces texts for papers in English language as aid in the drafting of suchwritings. For this, initially is provided NLG fundamental concepts, then is presented a reviewof tools associated with process, taken for implementation of a first software prototype thatexecute a basic procedure in new text obtaining. Results of this program identified the need of building a linguistics corpus with human helpand design of two sentences production strategies, first based on trees search and second inprobabilities calculations, using similarity between sentences brought together in DISGENsystem development. Results of this work is considered as a first contribution to Natural Language Generation in Industrial University of Santander domain and leaves open a referencefor the realization of projects related in local level. | |
| dc.description.degreelevel | Pregrado | |
| dc.description.degreename | Ingeniero de Sistemas | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | Universidad Industrial de Santander | |
| dc.identifier.reponame | Universidad Industrial de Santander | |
| dc.identifier.repourl | https://noesis.uis.edu.co | |
| dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/19890 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Industrial de Santander | |
| dc.publisher.faculty | Facultad de Ingenierías Fisicomecánicas | |
| dc.publisher.program | Ingeniería de Sistemas | |
| dc.publisher.school | Escuela de Ingeniería de Sistemas e Informática | |
| dc.rights | http://creativecommons.org/licenses/by/4.0/ | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0 | |
| dc.subject | Generación de Lenguaje Natural | |
| dc.subject | Teoría de la estructura retórica | |
| dc.subject | Corpus | |
| dc.subject | Similitudsemántica. | |
| dc.subject.keyword | Natural Language Generation | |
| dc.subject.keyword | Rethorical Structure Theory | |
| dc.subject.keyword | Corpus | |
| dc.subject.keyword | Semantic similarity. | |
| dc.title | Herramienta software para la generación automática de textos en inglés : un acercamiento a la generación de lenguaje natural | |
| dc.title.english | Software tool for automated english text generation: an approach to natural language generation.! | |
| dc.type.coar | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
| dc.type.hasversion | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
| dspace.entity.type | Publication |
