Clasificador basado en Principal Component Analisys (PCA) para predecir la presencia de cáncer de mama a partir de información extraída de los núcleos celulares de masa mamaria con el método de Aspiración de Aguja Fina (FNA)

Abstract
Este trabajo usó PCA como herramienta para reducir las dimensiones de una base de datos de la Universidad de Wisconsin del Departamento de Medicina y Ciencias Computacionales, donde se recoge información de características cuantificables de núcleos celulares de 569 personas y 32 atributos tales como: radio, textura, perímetro, área, simetría, concavidad, suavidad, compacidad, puntos cóncavos y dimensión fractal para desarrollar un clasificador el cual estime con mayor efectividad la presencia de Cáncer de Mama en el paciente usando los datos obtenidos de los núcleos de sus células mamarias contribuyendo al diagnóstico oportuno. La aplicación de PCA a esta información permitió desarrollar un clasificador óptimo que estima la presencia de cáncer de mama en sus etapas iniciales. Este clasificador hará un procesamiento de datos usando PCA para luego aplicar distintos clasificadores de Machine Learning, los resultados de estos serán utilizados en matrices de confusión para posteriormente ser contrastadas y así con el debido análisis e interpretación se corroboren los resultados y se examinen con los parámetros de rendimiento. A pesar de haber arrojado excelentes resultados la aplicación de PCA se comparó sin el uso de esta técnica la cual dio unos parámetros de rendimiento mayores, por lo que se concluye que es mejor incluir toda la base datos en el entrenamiento del clasificador puesto que prima la exactitud al momento de detectar cáncer.
Description
Keywords
Cáncer de mama, Data driven, Inteligencia Artificial, Machine Learning, PCA
Citation