Diseño de herramienta bioinformática para tabulación de secuencias de ácidos nucleicos de bases de datos públicas para usos biomédicos y de ciencia básica

Duarte Bernal, Rubén Oswaldo

Publicación:
Diseño de herramienta bioinformática para tabulación de secuencias de ácidos nucleicos de bases de datos públicas para usos biomédicos y de ciencia básica

dc.contributor.advisor	Bautista Rozo, Lola Xiomara
dc.contributor.advisor	Martinez Perez, Francisco Jose
dc.contributor.author	Duarte Bernal, Rubén Oswaldo
dc.date.accessioned	2024-03-04T00:45:40Z
dc.date.available	2020
dc.date.available	2024-03-04T00:45:40Z
dc.date.created	2020
dc.date.issued	2020
dc.description.abstract	Este proyecto presenta el desarrollo de una herramienta bioinformática para la tabulación de secuencias de ácidos nucleicos. Esta herramienta nace de la investigación desarrollada en el Laboratorio de Genómica de Celomados (GCL) en el diagnóstico del virus de influenza AH1N1 y en el estudio del uso preferencial de codones en Dopamina para posibles aplicaciones en psicosis, esquizofrenia y enfermedad de Parkinson. En el desarrollo de la investigación realizada, se abordó la etapa denominada preparación de datos, en la cual se tabulaban cada uno de los registros descargados del Genbank del National Center for Biotechnology Information (NCBI) con el fin de depurar la base de datos de registros incompletos o no congruentes. Este proceso demoraba el desarrollo de los proyectos de investigación elevando los tiempos de ejecución y los costos. Por lo mencionado anteriormente, se desarrolla una herramienta informática que permite agilizar esta etapa, enfocada en particular en la tabulación de las secuencias, usando un script de Python que le permitiría al investigador cargar los conjuntos de registros descargados sin tabular (en formato de texto plano), tomando estos registros y extrayendo las características del primer registro como criterios de búsqueda en el conjunto de datos, posteriormente extrayendo estas características en un tiempo menor de cada uno de los registros, construyendo una tabla de excel amigable con el investigador.
dc.description.abstractenglish	This work presents the development of a bioinformatic tool for the clasification of nucleic acid and protein sequences. This tool was borned from the research at the Genomic of Celomathe Laboratory (GCL) in the diagnose of the Influenza AH1N1 virus and the study of the preferential codon usage in Dopamin for possibles aplications on Psicosis, Schizophrenia and Parkinson disease. The first phase was the data preparation phase, in which the researchers clasified each downloaded record from the GenBank of the National Center for Biotechnology Information (NCBI) manually, to clean the database from uncompleted, or non congruent records. This process is time consuming and expensive. As mentioned above, we developed an informatic tool that agilizes this phase during the research, focus in the sequence tabulation using a Python script that allows the researcher to load the plain text records sets, the script takes this records and pulls out the characteristics of the first record as search criteria in the data set, then uses this criteria as search parameters for each one of the records and build an excel spreadsheet in less time friendly to the researcher.
dc.description.degreelevel	Pregrado
dc.description.degreename	Ingeniero de Sistemas
dc.format.mimetype	application/pdf
dc.identifier.instname	Universidad Industrial de Santander
dc.identifier.reponame	Universidad Industrial de Santander
dc.identifier.repourl	https://noesis.uis.edu.co
dc.identifier.uri	https://noesis.uis.edu.co/handle/20.500.14071/40392
dc.language.iso	spa
dc.publisher	Universidad Industrial de Santander
dc.publisher.faculty	Facultad de Ingenierías Fisicomecánicas
dc.publisher.program	Ingeniería de Sistemas
dc.publisher.school	Escuela de Ingeniería de Sistemas e Informática
dc.rights	http://creativecommons.org/licenses/by/4.0/
dc.rights.accessrights	info:eu-repo/semantics/openAccess
dc.rights.creativecommons	Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.license	Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.uri	http://creativecommons.org/licenses/by-nc/4.0
dc.subject	Bioinformática
dc.subject	Secuencias
dc.subject	Biología
dc.subject	Clasificación.
dc.subject.keyword	Bioinformatics
dc.subject.keyword	Sequences
dc.subject.keyword	Biology and Classification.
dc.title	Diseño de herramienta bioinformática para tabulación de secuencias de ácidos nucleicos de bases de datos públicas para usos biomédicos y de ciencia básica
dc.title.english	Design of a bioinformatic tool for the clasification of nucelic acid and protein sequences from public data bases for biomedical and basic cience uses.
dc.type.coar	http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversion	http://purl.org/coar/resource_type/c_7a1f
dc.type.local	Tesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.type	Publication