Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)Sierra Bueno, Daniel AlfonsoRondon Villarreal, Nydia PaolaLastre Dominguez, Carlos Mauricio2024-03-0320162024-03-0320162016https://noesis.uis.edu.co/handle/20.500.14071/34198El descubrimiento o síntesis de péptidos con propiedades antimicrobianas es una gran alternativa para combatir las bacterias multirresistentes. Sin embargo, existen limitaciones a la hora de encontrar estos péptidos. Por lo anterior, desde la bioinformática se trabaja en el uso de técnicas de clasificación para predecir la posible presencia de actividad antimicrobiana en un péptido candidato. Un reto asociado a estos estudios es que la cantidad de muestras de la clase antimicrobiana es poca ante la cantidad de muestras no antimicrobianas. En contraparte, en el caso de los pétidos antibacterianos son más los péptidos con características antibacterianas que los péptidos con características no antibacterianas. En la literarura se pueden encontrar diferentes estrategias y métodos de clasificación que tratan el problema del desbalanceo. En el presente trabajo se aplican metodologías de ensamble con estrategias a nivel de algoritmos y a nivel de datos buscando solucionar el problema del desbalanceo utilizando cinco reglas de combinación: media, máximo, mínimo, producto y mediana. Los péptidos utilizados en este trabajo fueron extraídos de la base de datos APD. Además, la evaluación de desempeño del ensamble con las diferentes estrategias de combinación se desarrolla a partir del análisis de las curvas ROC. En conclusión, nuestros resultados consideran que se debe estudiar en profundidad los algoritmos de clasificación de manera individual y explorar más las características de los datos.application/pdfspahttp://creativecommons.org/licenses/by/4.0/Ensamble De ClasificadoresClasificación De PéptidosReglas De CombinaciónEstrategias A Nivel De Datos Y De Algoritmos.Clasificación de péptidos a partir de diferentes métodos y estrategias de ensamble de clasificadores en condición desbalanceadaUniversidad Industrial de SantanderTesis/Trabajo de grado - Monografía - MaestriaUniversidad Industrial de Santanderhttps://noesis.uis.edu.coThe discovery and synthesis of peptides with antimicrobial properties is a promising alternative to fight against multi-resistant bacteria. There are multiple studies that deal with the classification of peptides according with their probability to possess antimicrobial activity. One of the challenges in these classification processes is related with the amount of available data. For the case of antibacterial peptides classifiersthe size of the positive class is much bigger than the negative class. In this workwe propose two strategies to deal with the imbalance situation of the data by using ensembles. The first one is based on algorithm modifications and the second one with data management. For each strategy we used five combination rules. The performance of the ensembles was calculated using the area under the ROC curve (AUC). Our results suggest that care must be taken with ensembles and that individual classifiers must be studied in-depth.Algorithms Level Ensemble, Classification Of Peptides, Combination Rules, Ensemble Of Classifiers, Data Level Ensemble, Learning Algorithms.info:eu-repo/semantics/openAccessAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)