Publicación: Diseño de herramienta bioinformática para tabulación de secuencias de ácidos nucleicos de bases de datos públicas para usos biomédicos y de ciencia básica
| dc.contributor.advisor | Bautista Rozo, Lola Xiomara | |
| dc.contributor.advisor | Martinez Perez, Francisco Jose | |
| dc.contributor.author | Duarte Bernal, Rubén Oswaldo | |
| dc.date.accessioned | 2024-03-04T00:45:40Z | |
| dc.date.available | 2020 | |
| dc.date.available | 2024-03-04T00:45:40Z | |
| dc.date.created | 2020 | |
| dc.date.issued | 2020 | |
| dc.description.abstract | Este proyecto presenta el desarrollo de una herramienta bioinformática para la tabulación de secuencias de ácidos nucleicos. Esta herramienta nace de la investigación desarrollada en el Laboratorio de Genómica de Celomados (GCL) en el diagnóstico del virus de influenza AH1N1 y en el estudio del uso preferencial de codones en Dopamina para posibles aplicaciones en psicosis, esquizofrenia y enfermedad de Parkinson. En el desarrollo de la investigación realizada, se abordó la etapa denominada preparación de datos, en la cual se tabulaban cada uno de los registros descargados del Genbank del National Center for Biotechnology Information (NCBI) con el fin de depurar la base de datos de registros incompletos o no congruentes. Este proceso demoraba el desarrollo de los proyectos de investigación elevando los tiempos de ejecución y los costos. Por lo mencionado anteriormente, se desarrolla una herramienta informática que permite agilizar esta etapa, enfocada en particular en la tabulación de las secuencias, usando un script de Python que le permitiría al investigador cargar los conjuntos de registros descargados sin tabular (en formato de texto plano), tomando estos registros y extrayendo las características del primer registro como criterios de búsqueda en el conjunto de datos, posteriormente extrayendo estas características en un tiempo menor de cada uno de los registros, construyendo una tabla de excel amigable con el investigador. | |
| dc.description.abstractenglish | This work presents the development of a bioinformatic tool for the clasification of nucleic acid and protein sequences. This tool was borned from the research at the Genomic of Celomathe Laboratory (GCL) in the diagnose of the Influenza AH1N1 virus and the study of the preferential codon usage in Dopamin for possibles aplications on Psicosis, Schizophrenia and Parkinson disease. The first phase was the data preparation phase, in which the researchers clasified each downloaded record from the GenBank of the National Center for Biotechnology Information (NCBI) manually, to clean the database from uncompleted, or non congruent records. This process is time consuming and expensive. As mentioned above, we developed an informatic tool that agilizes this phase during the research, focus in the sequence tabulation using a Python script that allows the researcher to load the plain text records sets, the script takes this records and pulls out the characteristics of the first record as search criteria in the data set, then uses this criteria as search parameters for each one of the records and build an excel spreadsheet in less time friendly to the researcher. | |
| dc.description.degreelevel | Pregrado | |
| dc.description.degreename | Ingeniero de Sistemas | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | Universidad Industrial de Santander | |
| dc.identifier.reponame | Universidad Industrial de Santander | |
| dc.identifier.repourl | https://noesis.uis.edu.co | |
| dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/40392 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Industrial de Santander | |
| dc.publisher.faculty | Facultad de Ingenierías Fisicomecánicas | |
| dc.publisher.program | Ingeniería de Sistemas | |
| dc.publisher.school | Escuela de Ingeniería de Sistemas e Informática | |
| dc.rights | http://creativecommons.org/licenses/by/4.0/ | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0 | |
| dc.subject | Bioinformática | |
| dc.subject | Secuencias | |
| dc.subject | Biología | |
| dc.subject | Clasificación. | |
| dc.subject.keyword | Bioinformatics | |
| dc.subject.keyword | Sequences | |
| dc.subject.keyword | Biology and Classification. | |
| dc.title | Diseño de herramienta bioinformática para tabulación de secuencias de ácidos nucleicos de bases de datos públicas para usos biomédicos y de ciencia básica | |
| dc.title.english | Design of a bioinformatic tool for the clasification of nucelic acid and protein sequences from public data bases for biomedical and basic cience uses. | |
| dc.type.coar | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
| dc.type.hasversion | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
| dspace.entity.type | Publication |
Archivos
Bloque original
1 - 3 de 3
Cargando...
- Nombre:
- Carta de autorización.pdf
- Tamaño:
- 1.05 MB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- Nota de proyecto.pdf
- Tamaño:
- 148.64 KB
- Formato:
- Adobe Portable Document Format
