Publicación: Sistema de interfaz natural Text-To-SQL para la consulta de bases de datos públicas del sector de Salud y Protección Social utilizando Procesamiento de Lenguaje Natural
| dc.contributor.advisor | Benavides Arévalo, Bernardo Andrés | |
| dc.contributor.author | Ramírez Calderón, Nicolás Andrés | |
| dc.contributor.author | Ortiz Medina, Alejandra | |
| dc.contributor.evaluator | Pedraza Ferreira, Gabriel Rodrigo | |
| dc.contributor.evaluator | Moreno Tarazona, Alejandra | |
| dc.date.accessioned | 2026-06-09T00:58:16Z | |
| dc.date.created | 2026-05-25 | |
| dc.date.issued | 2026-05-26 | |
| dc.description.abstract | La disponibilidad de datos abiertos gubernamentales se ha consolidado como un elemento clave para fortalecer la transparencia, la participación ciudadana y el desarrollo tecnológico. En Colombia, el Portal de Datos Abiertos reúne miles de conjuntos de datos públicos de diferentes sectores, entre los cuales destacan aquellos relacionados con salud y protección social por su impacto directo en la ciudadanía. No obstante, las alternativas actuales de consulta, como interfaces web, APIs y protocolos especializados de acceso a datos, requieren conocimientos técnicos que representan una barrera significativa para usuarios sin experiencia en bases de datos o lenguajes de consulta estructurados. Con el propósito de reducir estas limitaciones, este trabajo presenta el desarrollo de un prototipo de software basado en el paradigma Text-To-SQL, orientado a transformar consultas en lenguaje natural en sentencias SQL ejecutables mediante Modelos de Lenguaje de Gran Escala (Large Language Models, LLM). La arquitectura propuesta integra una interfaz de usuario, un módulo de inferencia semántica y una base de datos diseñada para consultar los conjuntos de datos Código Único de Medicamentos Vigentes (CUMV), Precios de Medicamentos (PM) y Listado de medicamentos de venta libre (LMVL). La validación del prototipo se realizó desde dos enfoques complementarios: el primero evaluó la precisión del módulo semántico mediante métricas del estado del arte en sistemas Text-To-SQL, y el segundo analizó la carga cognitiva y estructural asociada a distintos métodos de consulta sobre bases de datos públicas. Los resultados evidencian que la solución desarrollada facilita el acceso a los datos abiertos y constituye una alternativa reproducible y adaptable a otros dominios de información. | |
| dc.description.abstractenglish | The availability of open government data has become a key element in strengthening transparency, citizen participation, and technological development. In Colombia, the Open Data Portal brings together thousands of public datasets from different sectors, among which those related to health and social protection stand out due to their direct impact on citizens. However, current access methods, such as web interfaces, APIs, and specialized data access protocols, require technical knowledge that represents a significant barrier for users without experience in databases or structured query languages. With the aim of reducing these limitations, this work presents the development of a software prototype based on the Text-to-SQL paradigm, designed to transform natural language queries into executable SQL statements using Large Language Models (LLMs). The proposed architecture integrates a user interface, a semantic inference module, and a database designed to query the Unique Code of Current Medications (CUMV), Drug Prices (PM), and Over-the-Counter Medicines List (LMVL) datasets. The prototype was validated from two complementary perspectives: the first evaluated the semantic module’s accuracy using state-of-the-art metrics in Text-to-SQL systems, and the second analyzed the cognitive and structural load associated with different query methods over public databases. The results show that the developed solution facilitates access to open data and constitutes a reproducible and adaptable alternative for other information domains. | |
| dc.description.degreelevel | Pregrado | |
| dc.description.degreename | Ingeniero de Sistemas | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | Universidad Industrial de Santander | |
| dc.identifier.reponame | Universidad Industrial de Santander | |
| dc.identifier.repourl | https://noesis.uis.edu.co | |
| dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/47760 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Industrial de Santander | |
| dc.publisher.faculty | Facultad de Ingeníerias Fisicomecánicas | |
| dc.publisher.program | Ingeniería de Sistemas | |
| dc.publisher.school | Escuela de Ingeniería de Sistemas e Informática | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
| dc.subject | Procesamiento de Lenguaje Natural | |
| dc.subject | Text-To-SQL | |
| dc.subject | Modelos de Lenguaje de Gran Escala | |
| dc.subject | Datos Abiertos | |
| dc.subject | Bases de Datos | |
| dc.subject | Sector Salud. | |
| dc.subject.keyword | Natural Language Processing | |
| dc.subject.keyword | Databases | |
| dc.subject.keyword | Text-To-SQL | |
| dc.subject.keyword | Large Language Models | |
| dc.subject.keyword | Open Data | |
| dc.subject.keyword | Health Sector | |
| dc.title | Sistema de interfaz natural Text-To-SQL para la consulta de bases de datos públicas del sector de Salud y Protección Social utilizando Procesamiento de Lenguaje Natural | |
| dc.title.english | Text-To-SQL natural language interface system for querying public databases in the Health and Social Protection sector using Natural Language Processing | |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.hasversion | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
| dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
| dspace.entity.type | Publication |
Archivos
Bloque original
1 - 3 de 3
Cargando...
- Nombre:
- Nota de Proyecto.pdf
- Tamaño:
- 433.57 KB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- Carta de autorización de uso.pdf
- Tamaño:
- 93.9 KB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- Documento.pdf
- Tamaño:
- 1018.48 KB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 2.17 KB
- Formato:
- Item-specific license agreed to upon submission
- Descripción:
