Transfer Learning in Data-limited Scenarios for Breast Cancer Risk Assessment

dc.contributor.advisorPertuz Arroyo, Said David
dc.contributor.authorAfricano Ardila, Gerson Fernando
dc.contributor.evaluatorMiranda Mercado, David A.
dc.contributor.evaluatorHopper, John
dc.date.accessioned2022-09-24T01:29:36Z
dc.date.available2022-09-24T01:29:36Z
dc.date.created2022-09-17
dc.date.issued2022-09-17
dc.description.abstractLa evaluación precisa del riesgo de cáncer de mama tiene el potencial de reducir las tasas de mortalidad al mejorar la detección temprana y permitir la creación de recomendaciones personalizadas de cribado y prevención. Recientemente, algunos sistemas de IA diseñados para procesar imágenes de mamografía han demostrado ser prometedores a la hora de identificar mujeres con un alto riesgo de desarrollar cáncer de mama. Sin embargo, el desarrollo de los sistemas de IA requiere una gran cantidad de datos, lo cual dificulta la validación y adopción de los sistemas basados en IA en la práctica clínica. En este sentido, es imperativo identificar formas alternativas de desarrollar y validar sistemas fiables basados en IA con muestras más pequeñas. Este trabajo tiene como objetivo evaluar el potencial del aprendizaje de transferencia para desarrollar la evaluación del riesgo de cáncer de mama basada en IA en escenarios con datos limitados. Diseñamos un estudio de casos y controles con 1144 mamografías correspondientes a 143 mujeres diagnosticadas de cáncer de mama y 143 controles sanos emparejados. Para tranfer learning, seleccionamos un sistema de referencia desarrollado originalmente para la detección del cáncer de mama. Reentrenamos el sistema de referencia para la evaluación del riesgo de cáncer de mama en nuestra muestra de estudio. Evaluamos y comparamos el rendimiento de los sistemas antes (referencia) y después del transfer learning (reentrenado) con tres enfoques de evaluación de riesgo del estado del arte: densidad del seno, análisis parenquimatoso (OpenBreast) y método basado en IA de la literatura (Mirai). El rendimiento se evaluó en términos del área bajo la curva ROC (AUC) y odds ratio (OR) con intervalos de confianza (IC) del 95%. Las diferencias en el AUC se se evaluaron con la prueba de Delong. Se obtuvieron AUC de 0,57 (IC del 95%: 0,51-0,64), 0,55 (0,48-0,62), 0,48 (0,41-0,55), 0,59 (0,52-0,65) y 0,60 (0,54-0,67) y OR de 1,01 (0,80-1,28), 1,11 (0. 88-1,41), 0,92 (0,73-1,16), 1,36 (1,07-1,73) y 1,64 (1,08-2,51) para el sistema de referencia, el sistema reentrenado, la densidad del seno, OpenBreast, y Mirai, respectivamente. El uso de transfer learning no logró mejorar el rendimiento del sistema de referencia. Los resultados no mostraron ninguna diferencia estadística entre el sistema reentrenado y los enfoques de evaluación de riesgo del estado del arte.
dc.description.abstractenglishAccurate breast cancer risk assessment has the potential to reduce mortality rates by improving early detection and allowing the creation of personalized screening and prevention recommendations. Recently, some AI systems designed to process mammography images have shown promise in identifying women with a high risk of developing breast cancer. However, the development of AI systems is data-hungry, which is one of the reasons hampering the validation and adoption of AI-based systems in clinical practice. In this sense, it is imperative to identify alternative ways to develop and validate reliable AI-based systems with smaller samples. This work aims to evaluate the potential of transfer learning for developing AI-based breast cancer risk assessment in data-limited scenarios. We designed a case-control study with 1144 mammograms corresponding to 143 women diagnosed with breast cancer and 143 matched healthy controls. For transfer learning, we selected a baseline system that was originally developed for breast cancer detection.We retrained the baseline system for breast cancer risk assessment in our study sample. We evaluate and compare the performance of the baseline and retrained systems with three state-of-the-art risk assessment approaches: breast density, parenchymal analysis (OpenBreast), and AI-based method of the literature (Mirai). The performance was evaluated in terms of the area under the ROC curve (AUC) and per-standard deviation odds ratios (OR) with 95% confidence intervals (CI). Differences in AUC were assessed with Delong’s test. We obtained AUCs of 0.57 (95% CI 0.51-0.64), 0.55 (0.48-0.62), 0.48 (0.41-0.55), 0.59 (0.52-0.65), and 0.60 (0.54-0.67) and ORs of 1.01 (0.80-1.28), 1.11 (0.88-1.41), 0.92 (0.73-1.16), 1.36 (1.07-1.73), and 1.64 (1.08-2.51) for the baseline system, retrained system, breast density, OpenBreast, and Mirai, respectively. Transfer learning failed to improve the performance of the baseline system. The results showed no statistical difference between the retrained system and the considered state-of-the-art risk assessment approaches.
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Ingeniería Electrónica
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/11786
dc.language.isoeng
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingeníerias Fisicomecánicas
dc.publisher.programMaestría en Ingeniería Electrónica
dc.publisher.schoolEscuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectInteligencia artificial
dc.subjectTransfer learning
dc.subjectDataset pequeño
dc.subjectCáncer de seno
dc.subjectEvaluación de riesgo
dc.subject.keywordArtificial intelligence
dc.subject.keywordBreast cancer
dc.subject.keywordRisk assessment
dc.subject.keywordTransfer learning
dc.subject.keywordSmall dataset
dc.titleTransfer Learning in Data-limited Scenarios for Breast Cancer Risk Assessment
dc.title.englishTransfer Learning in Data-limited Scenarios for Breast Cancer Risk Assessment
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Maestría
dspace.entity.type
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
Documento.pdf
Size:
11.38 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
172.21 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
678.85 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.18 KB
Format:
Item-specific license agreed to upon submission
Description: