Publicación: Análisis de correlación de representaciones basadas en aprendizaje automático de características nucleares en imágenes histopatológicas con su expresión génica espacial
| dc.contributor.advisor | Romo Bucheli, David Edmundo | |
| dc.contributor.advisor | Rondón Villarreal, Nydia Paola | |
| dc.contributor.author | Robles Ardila, Jorge Daniel | |
| dc.contributor.author | Jaimes Rodríguez, Deciré Dayana | |
| dc.contributor.evaluator | Martínez Carrillo, Fabio | |
| dc.contributor.evaluator | Galvis Carreño, Laura Viviana | |
| dc.date.accessioned | 2026-06-08T22:56:05Z | |
| dc.date.created | 2026-05-26 | |
| dc.date.issued | 2026-05-26 | |
| dc.description.abstract | El análisis de imágenes histopatológicas ofrece una visión detallada de la estructura celular; por su parte, la transcriptómica espacial permite mapear la actividad génica conservando la arquitectura física del tejido. Relacionar ambas modalidades es fundamental para comprender la heterogeneidad tumoral en el cáncer. Sin embargo, a pesar de los avances del aprendizaje profundo en patología digital, continúa el desafío de identificar qué representaciones visuales de los núcleos celulares reflejan con mayor fidelidad estos patrones de expresión molecular. Para abordar este problema, el presente trabajo analiza cómo se correlacionan diversas representaciones de núcleos celulares con la expresión génica espacial, mediante muestras de tejido renal sano y canceroso del conjunto de datos HEST-1K. El estudio evalúa descriptores morfológicos tradicionales, grafos de interacción celular y representaciones latentes (embeddings) de modelos fundacionales como Virchow y UNI. A nivel metodológico, el proceso abarcó la mitigación de efectos de lote, la extracción de características multiescala y la construcción de un modelo de integración multimodal que fusiona la morfología visual con la topología celular. Los resultados demuestran que los embeddings extraídos de modelos fundacionales capturan de manera efectiva la asociación con perfiles génicos específicos. Aunque las representaciones basadas en grafos mostraron una capacidad predictiva limitada al evaluarse de forma aislada, su verdadero valor radica en la información estructural complementaria que aportan. Al integrar ambas modalidades, se supera de forma consistente a las representaciones individuales, alcanzando incrementos promedio en el coeficiente de determinación (R^2) de 0.010 en UNI, 0.009 en UNI2-h, 0.012 en Virchow y 0.009 en Virchow2. De manera complementaria, en este trabajo se plantea un método para la identificación de genes con dos características de interés: una mejor asociación con características morfológicas y mayor independencia con la información que pueda proveer una etiqueta (tejido tumoral o sano). | |
| dc.description.abstractenglish | The analysis of histopathological images provides a detailed view of cellular structure; in turn, spatial transcriptomics enables the mapping of gene activity while preserving the physical architecture of the tissue. Relating these two modalities is essential for understanding tumor heterogeneity in cancer. However, despite advances in deep learning applied to digital pathology, identifying which visual representations of cell nuclei most faithfully reflect these molecular expression patterns remains an open challenge. To address this problem, this work analyzes the correlation between different representations of cell nuclei and spatial gene expression, using samples of healthy and cancerous renal tissue from the HEST-1K dataset. The study evaluates traditional morphological descriptors, cell interaction graphs, and latent representations (embeddings) derived from foundation models such as Virchow and UNI. Methodologically, the approach includes batch effect correction, multiscale feature extraction, and the development of a multimodal integration model that combines visual morphology with cellular topology. The results show that embeddings extracted from foundation models effectively capture associations with specific gene expression profiles. While graph-based representations exhibit limited predictive performance when evaluated in isolation, they provide complementary structural information. By integrating both modalities, the proposed approach consistently outperforms individual representations, achieving average improvements in the coefficient of determination (R^2) of 0.010 for UNI, 0.009 for UNI2-h, 0.012 for Virchow, and 0.009 for Virchow2. Additionally, this work proposes a method for identifying genes of interest based on two criteria: stronger association with morphological features and greater independence from the information provided by the label (tumor or healthy tissue). | |
| dc.description.degreelevel | Pregrado | |
| dc.description.degreename | Ingeniero de Sistemas | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | Universidad Industrial de Santander | |
| dc.identifier.reponame | Universidad Industrial de Santander | |
| dc.identifier.repourl | https://noesis.uis.edu.co | |
| dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/47759 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Industrial de Santander | |
| dc.publisher.faculty | Facultad de Ingeníerias Fisicomecánicas | |
| dc.publisher.program | Ingeniería de Sistemas | |
| dc.publisher.school | Escuela de Ingeniería de Sistemas e Informática | |
| dc.rights | info:eu-repo/semantics/openAccess | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.license | Atribución-SinDerivadas 2.5 Colombia (CC BY-ND 2.5 CO) | |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Aprendizaje profundo | |
| dc.subject | imágenes histopatológicas | |
| dc.subject | transcriptómica espacial | |
| dc.subject | expresión génica | |
| dc.subject | cáncer | |
| dc.subject.keyword | Deep learning | |
| dc.subject.keyword | histopathological imaging | |
| dc.subject.keyword | spatial transcriptomics | |
| dc.subject.keyword | gene expression | |
| dc.subject.keyword | cancer | |
| dc.title | Análisis de correlación de representaciones basadas en aprendizaje automático de características nucleares en imágenes histopatológicas con su expresión génica espacial | |
| dc.title.english | Correlation analysis of machine learning-based representations of nuclear features in histopathological images with their spatial gene expression | |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.hasversion | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
| dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
| dspace.entity.type | Publication |
Archivos
Bloque original
1 - 3 de 3
Cargando...
- Nombre:
- Nota de proyecto.pdf
- Tamaño:
- 325.09 KB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- Carta de autorización de uso.pdf
- Tamaño:
- 101.26 KB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 2.17 KB
- Formato:
- Item-specific license agreed to upon submission
- Descripción:
