Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)Blanco Tirado, CristianDelgado Quintero, Dario JoseSolano Meza, Cindy Dayana2024-03-0320162024-03-0320162016https://noesis.uis.edu.co/handle/20.500.14071/34105Desde hace dos décadas, la secuenciación de genomas se ha convertido en un proceso de bajo costo. Cada genoma transcribe una gran cantidad de proteínas, cada una con una función específica en un organismo vivo. Entender su función es una tarea compleja debido a la cantidad de información de proteínas previamente identificas con las que se podrían comprar. Este escenario ha llevado a la implementación de métodos de comparación y análisis de secuencias que permitan extraer información estructural y funcional a partir de secuencias ya reconocidas. Se realizan comúnmente dos tipos de análisis sobre secuencias desconocidas: la detección de la identidad u homología a través de la alineación de secuencias o el análisis estructural. Estos métodos se centran en calcular una métrica porcentual de identidad entre secuencias; si el valor de identidad es superior al 35%, se considera entre pares de proteínas estructura similar, y para identidad inferiores al 25% secuencias sin similitud. Aquellos grupos de secuencias entre el 25% y 35% de identidad, se le denomina zona de penumbras (Twilight Zone [1]), en donde es confuso establecer características específicas entre pares de secuencias. En este trabajo se presenta un nuevo modelo para realizar la comparación de secuencias de proteínas con bajo porcentaje de identidad utilizando la transformada discreta de wavelet y el de análisis clúster hidrofóbicos (HCA [2]). El modelo se enfoca en un esquema de codificación de secuencias de proteínas utilizando la representación B y Q proporcionada por HCA [3,4] y los valores EIIP para cada aminoácido en la estructura primaria. Dicha información se emplea para tratar las secuencias de proteínas mediante la transformada discreta de Wavelet y el análisis de correlación. El método identifica posibles secuencias con homología estructural de manera automática donde al igual se identifica la wavelet madre con mejor aproximación a los resultados deseados.application/pdfspahttp://creativecommons.org/licenses/by/4.0/Análisis De Clusters Hidrofóbicos (Hca)AutomatizaciónComparación De ProteínasCorrelación De SeñalesTransformada Discreta De Wavelet (Dwt).Diseño de un sistema para la comparación automática de secuencias de proteínas basado en el análisis de Clusters Hidrofóbicos (hca).Universidad Industrial de SantanderTesis/Trabajo de grado - Monografía - MaestriaUniversidad Industrial de Santanderhttps://noesis.uis.edu.coOver the last two decadesgenome sequencing has become a low-cost process. Each genome transcripts several proteinseach one with a specific function inside a living organism. Understanding their function is a complex task due to the amount of protein information previously identified which they could be compared. This scenario has led to the implementation of comparison methods and sequence analysis that allow extracting structural and functional information from already known sequences. Two types of analysis are commonly performed over unknown sequences: Detecting identity or homology through sequence alignment or structural analysis. These methods focus on calculating a percentage measure of sequence identity. If the identity value exceeds 35%a similar structure between pairs of proteins is estimatedfor values lower than 25% the sequences have no similarities. Those groups of sequences that fall between a 25% and 35% identity value are considered within twilight zone [1]where is confusing to set specific characteristics between sequences. This work presents a new model for comparison of protein sequences with low percentage of identity using the discrete wavelet transform and hydrophobic cluster analysis (HCA [2]). The model focuses on an encoding scheme of protein sequences using the B and Q representation provided by HCA [34] and EIIP values for each amino acid in the primary structure. This information is used to process protein sequences using the discrete Wavelet transform and correlation analysis. The method identifies automatically potential sequences with structural homology likewisethe mother wavelet with the best approximation to the desired results is identified.Discrete Wavelet Transform (Dwt), Hydrophobic Cluster Analysis (Hca), Automatically Approach, Protein Sequence Comparison, Signal Correlation.info:eu-repo/semantics/openAccessAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)