Transfer Learning in Data-limited Scenarios for Breast Cancer Risk Assessment
dc.contributor.advisor | Pertuz Arroyo, Said David | |
dc.contributor.author | Africano Ardila, Gerson Fernando | |
dc.contributor.evaluator | Miranda Mercado, David A. | |
dc.contributor.evaluator | Hopper, John | |
dc.date.accessioned | 2022-09-24T01:29:36Z | |
dc.date.available | 2022-09-24T01:29:36Z | |
dc.date.created | 2022-09-17 | |
dc.date.issued | 2022-09-17 | |
dc.description.abstract | La evaluación precisa del riesgo de cáncer de mama tiene el potencial de reducir las tasas de mortalidad al mejorar la detección temprana y permitir la creación de recomendaciones personalizadas de cribado y prevención. Recientemente, algunos sistemas de IA diseñados para procesar imágenes de mamografía han demostrado ser prometedores a la hora de identificar mujeres con un alto riesgo de desarrollar cáncer de mama. Sin embargo, el desarrollo de los sistemas de IA requiere una gran cantidad de datos, lo cual dificulta la validación y adopción de los sistemas basados en IA en la práctica clínica. En este sentido, es imperativo identificar formas alternativas de desarrollar y validar sistemas fiables basados en IA con muestras más pequeñas. Este trabajo tiene como objetivo evaluar el potencial del aprendizaje de transferencia para desarrollar la evaluación del riesgo de cáncer de mama basada en IA en escenarios con datos limitados. Diseñamos un estudio de casos y controles con 1144 mamografías correspondientes a 143 mujeres diagnosticadas de cáncer de mama y 143 controles sanos emparejados. Para tranfer learning, seleccionamos un sistema de referencia desarrollado originalmente para la detección del cáncer de mama. Reentrenamos el sistema de referencia para la evaluación del riesgo de cáncer de mama en nuestra muestra de estudio. Evaluamos y comparamos el rendimiento de los sistemas antes (referencia) y después del transfer learning (reentrenado) con tres enfoques de evaluación de riesgo del estado del arte: densidad del seno, análisis parenquimatoso (OpenBreast) y método basado en IA de la literatura (Mirai). El rendimiento se evaluó en términos del área bajo la curva ROC (AUC) y odds ratio (OR) con intervalos de confianza (IC) del 95%. Las diferencias en el AUC se se evaluaron con la prueba de Delong. Se obtuvieron AUC de 0,57 (IC del 95%: 0,51-0,64), 0,55 (0,48-0,62), 0,48 (0,41-0,55), 0,59 (0,52-0,65) y 0,60 (0,54-0,67) y OR de 1,01 (0,80-1,28), 1,11 (0. 88-1,41), 0,92 (0,73-1,16), 1,36 (1,07-1,73) y 1,64 (1,08-2,51) para el sistema de referencia, el sistema reentrenado, la densidad del seno, OpenBreast, y Mirai, respectivamente. El uso de transfer learning no logró mejorar el rendimiento del sistema de referencia. Los resultados no mostraron ninguna diferencia estadística entre el sistema reentrenado y los enfoques de evaluación de riesgo del estado del arte. | |
dc.description.abstractenglish | Accurate breast cancer risk assessment has the potential to reduce mortality rates by improving early detection and allowing the creation of personalized screening and prevention recommendations. Recently, some AI systems designed to process mammography images have shown promise in identifying women with a high risk of developing breast cancer. However, the development of AI systems is data-hungry, which is one of the reasons hampering the validation and adoption of AI-based systems in clinical practice. In this sense, it is imperative to identify alternative ways to develop and validate reliable AI-based systems with smaller samples. This work aims to evaluate the potential of transfer learning for developing AI-based breast cancer risk assessment in data-limited scenarios. We designed a case-control study with 1144 mammograms corresponding to 143 women diagnosed with breast cancer and 143 matched healthy controls. For transfer learning, we selected a baseline system that was originally developed for breast cancer detection.We retrained the baseline system for breast cancer risk assessment in our study sample. We evaluate and compare the performance of the baseline and retrained systems with three state-of-the-art risk assessment approaches: breast density, parenchymal analysis (OpenBreast), and AI-based method of the literature (Mirai). The performance was evaluated in terms of the area under the ROC curve (AUC) and per-standard deviation odds ratios (OR) with 95% confidence intervals (CI). Differences in AUC were assessed with Delong’s test. We obtained AUCs of 0.57 (95% CI 0.51-0.64), 0.55 (0.48-0.62), 0.48 (0.41-0.55), 0.59 (0.52-0.65), and 0.60 (0.54-0.67) and ORs of 1.01 (0.80-1.28), 1.11 (0.88-1.41), 0.92 (0.73-1.16), 1.36 (1.07-1.73), and 1.64 (1.08-2.51) for the baseline system, retrained system, breast density, OpenBreast, and Mirai, respectively. Transfer learning failed to improve the performance of the baseline system. The results showed no statistical difference between the retrained system and the considered state-of-the-art risk assessment approaches. | |
dc.description.degreelevel | Maestría | |
dc.description.degreename | Magíster en Ingeniería Electrónica | |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad Industrial de Santander | |
dc.identifier.reponame | Universidad Industrial de Santander | |
dc.identifier.repourl | https://noesis.uis.edu.co | |
dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/11786 | |
dc.language.iso | eng | |
dc.publisher | Universidad Industrial de Santander | |
dc.publisher.faculty | Facultad de Ingeníerias Fisicomecánicas | |
dc.publisher.program | Maestría en Ingeniería Electrónica | |
dc.publisher.school | Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Inteligencia artificial | |
dc.subject | Transfer learning | |
dc.subject | Dataset pequeño | |
dc.subject | Cáncer de seno | |
dc.subject | Evaluación de riesgo | |
dc.subject.keyword | Artificial intelligence | |
dc.subject.keyword | Breast cancer | |
dc.subject.keyword | Risk assessment | |
dc.subject.keyword | Transfer learning | |
dc.subject.keyword | Small dataset | |
dc.title | Transfer Learning in Data-limited Scenarios for Breast Cancer Risk Assessment | |
dc.title.english | Transfer Learning in Data-limited Scenarios for Breast Cancer Risk Assessment | |
dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
dc.type.hasversion | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Maestría | |
dspace.entity.type |
Files
Original bundle
1 - 3 of 3
No Thumbnail Available
- Name:
- Carta de autorización.pdf
- Size:
- 172.21 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Nota de proyecto.pdf
- Size:
- 678.85 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 2.18 KB
- Format:
- Item-specific license agreed to upon submission
- Description: