Escuela de Ingeniería de Sistemas e Informática
Permanent URI for this community
Browse
Browsing Escuela de Ingeniería de Sistemas e Informática by Subject "a similar structure between pairs of proteins is estimated"
Now showing 1 - 1 of 1
Results Per Page
Sort Options
Item Diseño de un sistema para la comparación automática de secuencias de proteínas basado en el análisis de Clusters Hidrofóbicos (hca).(Universidad Industrial de Santander, 2016) Solano Meza, Cindy Dayana; Blanco Tirado, Cristian; Delgado Quintero, Dario JoseDesde hace dos décadas, la secuenciación de genomas se ha convertido en un proceso de bajo costo. Cada genoma transcribe una gran cantidad de proteínas, cada una con una función específica en un organismo vivo. Entender su función es una tarea compleja debido a la cantidad de información de proteínas previamente identificas con las que se podrían comprar. Este escenario ha llevado a la implementación de métodos de comparación y análisis de secuencias que permitan extraer información estructural y funcional a partir de secuencias ya reconocidas. Se realizan comúnmente dos tipos de análisis sobre secuencias desconocidas: la detección de la identidad u homología a través de la alineación de secuencias o el análisis estructural. Estos métodos se centran en calcular una métrica porcentual de identidad entre secuencias; si el valor de identidad es superior al 35%, se considera entre pares de proteínas estructura similar, y para identidad inferiores al 25% secuencias sin similitud. Aquellos grupos de secuencias entre el 25% y 35% de identidad, se le denomina zona de penumbras (Twilight Zone [1]), en donde es confuso establecer características específicas entre pares de secuencias. En este trabajo se presenta un nuevo modelo para realizar la comparación de secuencias de proteínas con bajo porcentaje de identidad utilizando la transformada discreta de wavelet y el de análisis clúster hidrofóbicos (HCA [2]). El modelo se enfoca en un esquema de codificación de secuencias de proteínas utilizando la representación B y Q proporcionada por HCA [3,4] y los valores EIIP para cada aminoácido en la estructura primaria. Dicha información se emplea para tratar las secuencias de proteínas mediante la transformada discreta de Wavelet y el análisis de correlación. El método identifica posibles secuencias con homología estructural de manera automática donde al igual se identifica la wavelet madre con mejor aproximación a los resultados deseados.