Clasificador basado en Principal Component Analisys (PCA) para predecir la presencia de cáncer de mama a partir de información extraída de los núcleos celulares de masa mamaria con el método de Aspiración de Aguja Fina (FNA)

dc.contributor.advisorQuiroga Méndez, Jabid Eduardo
dc.contributor.authorRogeles Sánchez, Sebastián
dc.contributor.authorPérez Guerrero, Yuliana Andrea
dc.contributor.evaluatorGonzález Estrada, Octavio Andrés
dc.contributor.evaluatorPinto Hernández, William
dc.date.accessioned2022-11-17T12:35:26Z
dc.date.available2022-11-17T12:35:26Z
dc.date.created2022-11-16
dc.date.issued2022-11-16
dc.description.abstractEste trabajo usó PCA como herramienta para reducir las dimensiones de una base de datos de la Universidad de Wisconsin del Departamento de Medicina y Ciencias Computacionales, donde se recoge información de características cuantificables de núcleos celulares de 569 personas y 32 atributos tales como: radio, textura, perímetro, área, simetría, concavidad, suavidad, compacidad, puntos cóncavos y dimensión fractal para desarrollar un clasificador el cual estime con mayor efectividad la presencia de Cáncer de Mama en el paciente usando los datos obtenidos de los núcleos de sus células mamarias contribuyendo al diagnóstico oportuno. La aplicación de PCA a esta información permitió desarrollar un clasificador óptimo que estima la presencia de cáncer de mama en sus etapas iniciales. Este clasificador hará un procesamiento de datos usando PCA para luego aplicar distintos clasificadores de Machine Learning, los resultados de estos serán utilizados en matrices de confusión para posteriormente ser contrastadas y así con el debido análisis e interpretación se corroboren los resultados y se examinen con los parámetros de rendimiento. A pesar de haber arrojado excelentes resultados la aplicación de PCA se comparó sin el uso de esta técnica la cual dio unos parámetros de rendimiento mayores, por lo que se concluye que es mejor incluir toda la base datos en el entrenamiento del clasificador puesto que prima la exactitud al momento de detectar cáncer.
dc.description.abstractenglishThis thesis used PCA as a tool to reduce the dimensions of a database from the University of Wisconsin Department of Medicine and Computer Science, where quantifiable feature information is collected from cell nuclei of 569 individuals and 32 attributes such as: radius, texture, perimeter, area, symmetry, concavity, smoothness, compactness, concave points and fractal dimension to develop a classifier which more effectively estimates the presence of Breast Cancer in the patient using the data obtained from the nuclei of their breast cells contributing to timely diagnosis. The application of PCA to this information allowed the development of an optimal classifier that estimates the presence of breast cancer in its early stages. This classifier will do a data processing using PCA to then apply different Machine Learning classifiers, the results of these will be used in confusion matrices to later be contrasted and thus with the proper analysis and interpretation the results will be corroborated and examined with the performance parameters. In spite of having yielded excellent results, the application of PCA was compared without the use of this technique, which gave higher performance parameters, so it is concluded that it is better to include the entire database in the training of the classifier, since accuracy at the time of detecting cancer is more important.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Mecánico
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/12155
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingeníerias Fisicomecánicas
dc.publisher.programIngeniería Mecánica
dc.publisher.schoolEscuela de Ingeniería Mecánica
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectCáncer de mama
dc.subjectData driven
dc.subjectInteligencia Artificial
dc.subjectMachine Learning
dc.subjectPCA
dc.subject.keywordArtificial Intelligence
dc.subject.keywordBreast Cancer
dc.subject.keywordData driven
dc.subject.keywordMachine Learning
dc.subject.keywordPCA
dc.titleClasificador basado en Principal Component Analisys (PCA) para predecir la presencia de cáncer de mama a partir de información extraída de los núcleos celulares de masa mamaria con el método de Aspiración de Aguja Fina (FNA)
dc.title.englishPrincipal Component Analysis (PCA) based classifier for predicting the presence of breast cancer from information extracted from breast mass cell nuclei using Fine Needle Aspiration (FNA) method
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.type
Files
Original bundle
Now showing 1 - 4 of 4
No Thumbnail Available
Name:
Documento.pdf
Size:
1.35 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
154.74 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
138.31 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
573.04 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.18 KB
Format:
Item-specific license agreed to upon submission
Description: