Publicación: DETECCIÓN TEMPRANA DE SEPSIS A PARTIR DE DATOS CLÍNICOS USANDO APRENDIZAJE AUTOMÁTICO
| dc.contributor.advisor | Santos Ortiz, Camilo Andres | |
| dc.contributor.advisor | Rodriguez Rodriguez, Harold Hernando | |
| dc.contributor.advisor | Fajardo Ariza, Carlos Augusto | |
| dc.contributor.author | Rico Torres, Josman Esneider | |
| dc.contributor.author | Torres Pedraza, Deisy Tatiana | |
| dc.contributor.evaluator | Sepulveda Sepulveda, Franklin Alexander | |
| dc.contributor.evaluator | Pertuz Arroyo, Said David | |
| dc.date.accessioned | 2025-11-12T19:50:49Z | |
| dc.date.available | 2025-11-12T19:50:49Z | |
| dc.date.created | 2025-11-12 | |
| dc.date.issued | 2025-11-12 | |
| dc.description.abstract | La sepsis es una disfunción orgánica potencialmente mortal causada por una respuesta desregulada del paciente ante una infección, lo que representa una prioridad de salud mundial con una estimación de 11 millones de muertes al año. Su detección temprana sigue siendo un reto fundamental en las unidades de cuidados intensivos (UCI), donde los síntomas iniciales inespecíficos, la gran heterogeneidad de los datos y los frecuentes valores faltantes en los registros médicos electrónicos a menudo retrasan la intervención y empeoran los resultados de los pacientes. En respuesta a ello, este estudio propone una novedosa metodología orientada al paciente para la identificación anticipada de sepsis mediante el aprendizaje automático en la base de datos de PhysioNet Challenge. Nuestra principal contribución radica en el desarrollo de un proceso de estructuración de datos temporales que incorpora una ventana de observación única de 21 horas alineada con el inicio de la sepsis, procesada a través de ventanas deslizantes de 6 horas para captar la evolución clínica, y que emplea la imputación multivariable utilizando LightGBM y optimización bayesiana. Entre los modelos de refuerzo, que alcanzaron colectivamente un AUC-ROC$>$0.93, CatBoost demostró el rendimiento más equilibrado, alcanzando la mayor sensibilidad (0,720) y puntuación de utilidad (0,668). Nuestros modelos no solo lograron un rendimiento competitivo frente a los métodos más avanzados, sino que también proporcionaron información clínica significativa a través del análisis SHAP, identificando la duración de la estancia en UCI, los niveles BUN y los patrones respiratorios como predictores claves. Estos resultados demuestran que nuestro flujo de preprocesamiento sistemático y sensible al tiempo ofrece un marco robusto para los sistemas de apoyo a la toma de decisiones clínicas. | |
| dc.description.abstractenglish | Sepsis is a life-threatening organ dysfunction caused by a dysregulated host response to infection, representing a global health priority with an estimated 11 million deaths annually. Its early detection remains a critical challenge in intensive care units (ICUs), where nonspecific early symptoms, high data heterogeneity, and frequent missing values in electronic health records often delay intervention and worsen patient outcomes. In response, this study proposes a novel patient-oriented methodology for early sepsis detection using machine learning on the PhysioNet Challenge database. Our main contribution lies in the development of a comprehensive temporal data structuring pipeline that incorporates a unique 21-hour observation window aligned with sepsis onset, processed through 6-hour sliding windows to capture clinical evolution, and employs multivariate imputation using LightGBM and Bayesian optimization. Among the boosting models, which collectively achieved AUC-ROC $>$0.93, CatBoost demonstrated the most balanced performance, attaining the highest sensitivity (0.720) and utility score (0.668). Our models not only achieved competitive performance against state-of-the-art methods but also provided clinically meaningful insights through SHAP analysis, identifying ICU length of stay, BUN levels, and respiratory patterns as key predictors. These results demonstrate that our systematic and temporally-aware preprocessing pipeline offers a robust framework for clinical decision-support systems. | |
| dc.description.degreelevel | Pregrado | |
| dc.description.degreename | Ingeniero Electrónico | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | Universidad Industrial de Santander | |
| dc.identifier.reponame | Universidad Industrial de Santander | |
| dc.identifier.repourl | https://noesis.uis.edu.co | |
| dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/46399 | |
| dc.language.iso | eng | |
| dc.publisher | Universidad Industrial de Santander | |
| dc.publisher.faculty | Facultad de Ingeníerias Fisicomecánicas | |
| dc.publisher.program | Ingeniería Electrónica | |
| dc.publisher.school | Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones | |
| dc.rights | info:eu-repo/semantics/openAccess | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.license | Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO) | |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Detección temprana | |
| dc.subject | unidad de cuidados intensivos | |
| dc.subject | aprendizaje automático | |
| dc.subject | PhysioNet Challenge | |
| dc.subject | segmentación temporal | |
| dc.subject.keyword | Early detection | |
| dc.subject.keyword | intensive care units | |
| dc.subject.keyword | machine learning | |
| dc.subject.keyword | PhysioNet Challenge | |
| dc.subject.keyword | temporal segmentation | |
| dc.title | DETECCIÓN TEMPRANA DE SEPSIS A PARTIR DE DATOS CLÍNICOS USANDO APRENDIZAJE AUTOMÁTICO | |
| dc.title.english | EARLY DETECTION OF SEPSIS FROM CLINICAL DATA USING MACHINE LEARNING | |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.hasversion | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
| dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
| dspace.entity.type | Publication |
Archivos
Bloque original
1 - 4 de 4
Cargando...
- Nombre:
- Documento.pdf
- Tamaño:
- 597.01 KB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- Carta de autorización.pdf
- Tamaño:
- 107.45 KB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- Nota de proyecto.pdf
- Tamaño:
- 332.25 KB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 2.17 KB
- Formato:
- Item-specific license agreed to upon submission
- Descripción:
