Clasificación de péptidos a partir de diferentes métodos y estrategias de ensamble de clasificadores en condición desbalanceada

dc.contributor.advisorSierra Bueno, Daniel Alfonso
dc.contributor.advisorRondon Villarreal, Nydia Paola
dc.contributor.authorLastre Dominguez, Carlos Mauricio
dc.date.accessioned2024-03-03T22:35:34Z
dc.date.available2016
dc.date.available2024-03-03T22:35:34Z
dc.date.created2016
dc.date.issued2016
dc.description.abstractEl descubrimiento o síntesis de péptidos con propiedades antimicrobianas es una gran alternativa para combatir las bacterias multirresistentes. Sin embargo, existen limitaciones a la hora de encontrar estos péptidos. Por lo anterior, desde la bioinformática se trabaja en el uso de técnicas de clasificación para predecir la posible presencia de actividad antimicrobiana en un péptido candidato. Un reto asociado a estos estudios es que la cantidad de muestras de la clase antimicrobiana es poca ante la cantidad de muestras no antimicrobianas. En contraparte, en el caso de los pétidos antibacterianos son más los péptidos con características antibacterianas que los péptidos con características no antibacterianas. En la literarura se pueden encontrar diferentes estrategias y métodos de clasificación que tratan el problema del desbalanceo. En el presente trabajo se aplican metodologías de ensamble con estrategias a nivel de algoritmos y a nivel de datos buscando solucionar el problema del desbalanceo utilizando cinco reglas de combinación: media, máximo, mínimo, producto y mediana. Los péptidos utilizados en este trabajo fueron extraídos de la base de datos APD. Además, la evaluación de desempeño del ensamble con las diferentes estrategias de combinación se desarrolla a partir del análisis de las curvas ROC. En conclusión, nuestros resultados consideran que se debe estudiar en profundidad los algoritmos de clasificación de manera individual y explorar más las características de los datos.
dc.description.abstractenglishClassification of peptides from different methods and strategies of ensemble of classifiers with imbalanced data
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Ingeniería Electrónica
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/34198
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programMaestría en Ingeniería Electrónica
dc.publisher.schoolEscuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
dc.rightshttp://creativecommons.org/licenses/by/4.0/
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0
dc.subjectEnsamble De Clasificadores
dc.subjectClasificación De Péptidos
dc.subjectReglas De Combinación
dc.subjectEstrategias A Nivel De Datos Y De Algoritmos.
dc.subject.keywordThe discovery and synthesis of peptides with antimicrobial properties is a promising alternative to fight against multi-resistant bacteria. There are multiple studies that deal with the classification of peptides according with their probability to possess antimicrobial activity. One of the challenges in these classification processes is related with the amount of available data. For the case of antibacterial peptides classifiers
dc.subject.keywordthe size of the positive class is much bigger than the negative class. In this work
dc.subject.keywordwe propose two strategies to deal with the imbalance situation of the data by using ensembles. The first one is based on algorithm modifications and the second one with data management. For each strategy we used five combination rules. The performance of the ensembles was calculated using the area under the ROC curve (AUC). Our results suggest that care must be taken with ensembles and that individual classifiers must be studied in-depth.
dc.titleClasificación de péptidos a partir de diferentes métodos y estrategias de ensamble de clasificadores en condición desbalanceada
dc.title.englishAlgorithms Level Ensemble, Classification Of Peptides, Combination Rules, Ensemble Of Classifiers, Data Level Ensemble, Learning Algorithms.
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_bdcc
dc.type.localTesis/Trabajo de grado - Monografía - Maestria
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
134.59 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
1.44 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
85.75 KB
Format:
Adobe Portable Document Format