Detección de pólipos en secuencias largas de colonoscopia siguiendo esquemas no supervisados.

Abstract
En Colombia, durante el año 2020, se diagnosticaron 11 mil nuevos casos de cáncer de colon, siendo el tercer tipo de cáncer con mayor incidencia a nivel nacional. Además, mundialmente se reportaron cerca de 2 millones de casos nuevos, siendo el tercer tipo de cáncer con mayor incidencia. Los pólipos observados durante procedimientos de colonoscopia son los principales precursores de la enfermedad y su detección temprana está asociada con mejores pronósticos. Sin embargo, la tarea de detección de estas masas es desafiante, incluso para expertos gastroenterólogos, reportando hasta un 26% de pólipos no clasificados. Las herramientas computacionales para la detección y caracterización de pólipos han permitido soportar estos procedimientos, pero siguen reportando limitaciones en ambientes reales debido a movimientos de cámara, similitud textural con pliegues intestinales, entre otros artefactos de la escena. Además, la escasez es un desafió adicional, apareciendo en menos del 10% de una secuencia de colonoscopia. En este trabajo se exploraron dos estrategias de entrenamiento débilmente supervisadas para la detección de cáncer colorrectal. Primero, se utiliza un modelo del estado del arte basado en una arquitectura multiatención, que se entrenó bajo un esquema de aprendizaje semisupervisado, realizando una tarea de segmentación binaria de pólipos. Durante este proceso, solo se incluyó un subconjunto de entrenamiento para simular escenarios con, complementando la información con pseudoetiquetas que complementan observaciones para ajustar el modelo. También en este trabajo se adopto la arquitectura de aprendizaje profunda, para ajustarla en un esquema autosupervisado, siguiendo una tarea de reconstrucción. De esta arquitectura se implementó una estrategia para la detección (patrones no vistos durante el entrenamiento) utilizando únicamente datos del tracto intestinal. Estos dos enfoques fueron validados en dos conjuntos diferentes de datos, públicos y secuencias largas de colonoscopia, para evaluar el desempeño y generalización del modelo.
Description
Keywords
Citation