Logotipo del repositorio

Publicación:
Sistema de interfaz natural Text-To-SQL para la consulta de bases de datos públicas del sector de Salud y Protección Social utilizando Procesamiento de Lenguaje Natural

dc.contributor.advisorBenavides Arévalo, Bernardo Andrés
dc.contributor.authorRamírez Calderón, Nicolás Andrés
dc.contributor.authorOrtiz Medina, Alejandra
dc.contributor.evaluatorPedraza Ferreira, Gabriel Rodrigo
dc.contributor.evaluatorMoreno Tarazona, Alejandra
dc.date.accessioned2026-06-09T00:58:16Z
dc.date.created2026-05-25
dc.date.issued2026-05-26
dc.description.abstractLa disponibilidad de datos abiertos gubernamentales se ha consolidado como un elemento clave para fortalecer la transparencia, la participación ciudadana y el desarrollo tecnológico. En Colombia, el Portal de Datos Abiertos reúne miles de conjuntos de datos públicos de diferentes sectores, entre los cuales destacan aquellos relacionados con salud y protección social por su impacto directo en la ciudadanía. No obstante, las alternativas actuales de consulta, como interfaces web, APIs y protocolos especializados de acceso a datos, requieren conocimientos técnicos que representan una barrera significativa para usuarios sin experiencia en bases de datos o lenguajes de consulta estructurados. Con el propósito de reducir estas limitaciones, este trabajo presenta el desarrollo de un prototipo de software basado en el paradigma Text-To-SQL, orientado a transformar consultas en lenguaje natural en sentencias SQL ejecutables mediante Modelos de Lenguaje de Gran Escala (Large Language Models, LLM). La arquitectura propuesta integra una interfaz de usuario, un módulo de inferencia semántica y una base de datos diseñada para consultar los conjuntos de datos Código Único de Medicamentos Vigentes (CUMV), Precios de Medicamentos (PM) y Listado de medicamentos de venta libre (LMVL). La validación del prototipo se realizó desde dos enfoques complementarios: el primero evaluó la precisión del módulo semántico mediante métricas del estado del arte en sistemas Text-To-SQL, y el segundo analizó la carga cognitiva y estructural asociada a distintos métodos de consulta sobre bases de datos públicas. Los resultados evidencian que la solución desarrollada facilita el acceso a los datos abiertos y constituye una alternativa reproducible y adaptable a otros dominios de información.
dc.description.abstractenglishThe availability of open government data has become a key element in strengthening transparency, citizen participation, and technological development. In Colombia, the Open Data Portal brings together thousands of public datasets from different sectors, among which those related to health and social protection stand out due to their direct impact on citizens. However, current access methods, such as web interfaces, APIs, and specialized data access protocols, require technical knowledge that represents a significant barrier for users without experience in databases or structured query languages. With the aim of reducing these limitations, this work presents the development of a software prototype based on the Text-to-SQL paradigm, designed to transform natural language queries into executable SQL statements using Large Language Models (LLMs). The proposed architecture integrates a user interface, a semantic inference module, and a database designed to query the Unique Code of Current Medications (CUMV), Drug Prices (PM), and Over-the-Counter Medicines List (LMVL) datasets. The prototype was validated from two complementary perspectives: the first evaluated the semantic module’s accuracy using state-of-the-art metrics in Text-to-SQL systems, and the second analyzed the cognitive and structural load associated with different query methods over public databases. The results show that the developed solution facilitates access to open data and constitutes a reproducible and adaptable alternative for other information domains.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero de Sistemas
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/47760
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingeníerias Fisicomecánicas
dc.publisher.programIngeniería de Sistemas
dc.publisher.schoolEscuela de Ingeniería de Sistemas e Informática
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.subjectProcesamiento de Lenguaje Natural
dc.subjectText-To-SQL
dc.subjectModelos de Lenguaje de Gran Escala
dc.subjectDatos Abiertos
dc.subjectBases de Datos
dc.subjectSector Salud.
dc.subject.keywordNatural Language Processing
dc.subject.keywordDatabases
dc.subject.keywordText-To-SQL
dc.subject.keywordLarge Language Models
dc.subject.keywordOpen Data
dc.subject.keywordHealth Sector
dc.titleSistema de interfaz natural Text-To-SQL para la consulta de bases de datos públicas del sector de Salud y Protección Social utilizando Procesamiento de Lenguaje Natural
dc.title.englishText-To-SQL natural language interface system for querying public databases in the Health and Social Protection sector using Natural Language Processing
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.typePublication

Archivos

Bloque original

Mostrando 1 - 3 de 3
Cargando...
Miniatura
Nombre:
Nota de Proyecto.pdf
Tamaño:
433.57 KB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Carta de autorización de uso.pdf
Tamaño:
93.9 KB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Documento.pdf
Tamaño:
1018.48 KB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
2.17 KB
Formato:
Item-specific license agreed to upon submission
Descripción:

VIGILADA MINEDUCACIÓN

Ordenanza No. 83 de 1.944 (junio 22)

Carácter académico: Universidad

Notificaciones judiciales: notjudiciales@uis.edu.co 

.

Código SNIES: 1204   Nit: 890.201.213-4

Línea Anticorrupción:  +57 (601) 562 9300 EXT: 3633

Línea transparente: +57 (607) 630 3031