Diseño de un sistema para la comparación automática de secuencias de proteínas basado en el análisis de Clusters Hidrofóbicos (hca).

dc.contributor.advisorBlanco Tirado, Cristian
dc.contributor.advisorDelgado Quintero, Dario Jose
dc.contributor.authorSolano Meza, Cindy Dayana
dc.date.accessioned2024-03-03T22:34:05Z
dc.date.available2016
dc.date.available2024-03-03T22:34:05Z
dc.date.created2016
dc.date.issued2016
dc.description.abstractDesde hace dos décadas, la secuenciación de genomas se ha convertido en un proceso de bajo costo. Cada genoma transcribe una gran cantidad de proteínas, cada una con una función específica en un organismo vivo. Entender su función es una tarea compleja debido a la cantidad de información de proteínas previamente identificas con las que se podrían comprar. Este escenario ha llevado a la implementación de métodos de comparación y análisis de secuencias que permitan extraer información estructural y funcional a partir de secuencias ya reconocidas. Se realizan comúnmente dos tipos de análisis sobre secuencias desconocidas: la detección de la identidad u homología a través de la alineación de secuencias o el análisis estructural. Estos métodos se centran en calcular una métrica porcentual de identidad entre secuencias; si el valor de identidad es superior al 35%, se considera entre pares de proteínas estructura similar, y para identidad inferiores al 25% secuencias sin similitud. Aquellos grupos de secuencias entre el 25% y 35% de identidad, se le denomina zona de penumbras (Twilight Zone [1]), en donde es confuso establecer características específicas entre pares de secuencias. En este trabajo se presenta un nuevo modelo para realizar la comparación de secuencias de proteínas con bajo porcentaje de identidad utilizando la transformada discreta de wavelet y el de análisis clúster hidrofóbicos (HCA [2]). El modelo se enfoca en un esquema de codificación de secuencias de proteínas utilizando la representación B y Q proporcionada por HCA [3,4] y los valores EIIP para cada aminoácido en la estructura primaria. Dicha información se emplea para tratar las secuencias de proteínas mediante la transformada discreta de Wavelet y el análisis de correlación. El método identifica posibles secuencias con homología estructural de manera automática donde al igual se identifica la wavelet madre con mejor aproximación a los resultados deseados.
dc.description.abstractenglishDesign of a system for automatic comparison for protein sequences based hydrophobic cluster analysis (hca)3.
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Ingeniería de Sistemas e Informática
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/34105
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programMaestría en Ingeniería de Sistemas e Informática
dc.publisher.schoolEscuela de Ingeniería de Sistemas e Informática
dc.rightshttp://creativecommons.org/licenses/by/4.0/
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0
dc.subjectAnálisis De Clusters Hidrofóbicos (Hca)
dc.subjectAutomatización
dc.subjectComparación De Proteínas
dc.subjectCorrelación De Señales
dc.subjectTransformada Discreta De Wavelet (Dwt).
dc.subject.keywordOver the last two decades
dc.subject.keywordgenome sequencing has become a low-cost process. Each genome transcripts several proteins
dc.subject.keywordeach one with a specific function inside a living organism. Understanding their function is a complex task due to the amount of protein information previously identified which they could be compared. This scenario has led to the implementation of comparison methods and sequence analysis that allow extracting structural and functional information from already known sequences. Two types of analysis are commonly performed over unknown sequences: Detecting identity or homology through sequence alignment or structural analysis. These methods focus on calculating a percentage measure of sequence identity. If the identity value exceeds 35%
dc.subject.keyworda similar structure between pairs of proteins is estimated
dc.subject.keywordfor values lower than 25% the sequences have no similarities. Those groups of sequences that fall between a 25% and 35% identity value are considered within twilight zone [1]
dc.subject.keywordwhere is confusing to set specific characteristics between sequences. This work presents a new model for comparison of protein sequences with low percentage of identity using the discrete wavelet transform and hydrophobic cluster analysis (HCA [2]). The model focuses on an encoding scheme of protein sequences using the B and Q representation provided by HCA [3
dc.subject.keyword4] and EIIP values for each amino acid in the primary structure. This information is used to process protein sequences using the discrete Wavelet transform and correlation analysis. The method identifies automatically potential sequences with structural homology likewise
dc.subject.keywordthe mother wavelet with the best approximation to the desired results is identified.
dc.titleDiseño de un sistema para la comparación automática de secuencias de proteínas basado en el análisis de Clusters Hidrofóbicos (hca).
dc.title.englishDiscrete Wavelet Transform (Dwt), Hydrophobic Cluster Analysis (Hca), Automatically Approach, Protein Sequence Comparison, Signal Correlation.
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_bdcc
dc.type.localTesis/Trabajo de grado - Monografía - Maestria
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
313.45 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
3.17 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
244.56 KB
Format:
Adobe Portable Document Format