Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1

Acuña Carvajal, Cristina Isabel

Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1

dc.contributor.advisor	Barrios Hernández, Carlos Jaime
dc.contributor.author	Acuña Carvajal, Cristina Isabel
dc.date.accessioned	2023-04-05T03:43:18Z
dc.date.available	2023
dc.date.available	2023-04-05T03:43:18Z
dc.date.created	2019
dc.date.issued	2019
dc.description.abstract	En la pandemia de Influenza A H1N1 del 2009, algunos pacientes que presentaban la sintomatología de infección por este virus eran diagnosticados como falsos negativos por la RT-PCR, debido a la ausencia en la polimerización de los genes para la Hemaglutinina (HA), Nucleocápside y las Proteínas de Matriz M1 y M2. Con una base de datos que incluyó todas las secuencias genómicas hasta el año 2010 del virus, generada por 10 personas durante 18 meses, se determinó que el resultado fue debido a procesos evolutivos del genoma viral; por ello, fueron diseñados nuevos cebadores que diagnosticaron la infección en 150 pacientes. Para solucionar los tiempos de construcción de la base de datos, se generó el programa BioDataToolkit v1.0 cuyo objetivo fue obtener del GenBank: la fecha de colección, país, hospedero, organismo, segmento, serotipo, cepa, el número de acceso y el ORF de cada cepa, para ubicarlos por columnas en Excel, para manejar la información en minutos. Sin embargo, el programa no había sido determinado a nivel biológico, lo cual se realizó en esta pasantía con el gen HA del virus de Influenza A H1N1 del 2017. Se determinó que la combinación óptima para obtener la mayoría de las secuencias fue “Influenza a virus 4 segment h1n1 2017 complete CDS”; con ellas, se generó un formato GenBank full que empleó el programa para su análisis. Desde la versión 1.0 se generó la página de Excel, pero la información no permitía análisis biológicos por tanto los programadores realizaron las modificaciones requeridas en cada validación hasta generar la versión 5.0 la cual permite obtener la información de cada secuencia en columnas y los formatos Fasta en minutos, para la generación de secuencias consenso y análisis filogenéticos. Sin embargo, es necesario la generación de la v6.0 para concluir la optimización del programa BioDataToolkit.
dc.description.abstractenglish	In the pandemic Influenza A H1N1 of 2009, some patients who had the symptomatology of infection with this virus were diagnosed as negatives false by RT-PCR, due to the absence in polymerization of genes for Hemagglutinin (HA), Nucleocapsid (HA), and matrix proteins M1 and M2. With a database that included all genomic sequences up to the year 2010 of the virus, generated by 10 people for 18 months, it was determined that the result was due to evolutionary processes of the viral genome. Therefore, new primers that diagnosed the infection in 150 patients were designed. In order to solve the construction times of the database, the BioDataToolkit v1.0 program was generated whose objective was to obtain from GenBank: the collection date, country, host country, organism, segment, serotype, strain, the access number and ORF of each strain, to be placed by columns in Excel, to handle the information in minutes. However, the program had not been determined biologically, which was done in this internship with the HA gene of the Influenza A H1N1 virus of 2017. It was determined that the optimal combination to obtain most sequences was "Influenza a virus 4 Segment h1n1 2017 complete CDS"; with them, a full GenBank format was generated that used the program for analysis. Since version 1.0 the Excel page was generated but the information did not allow biological analysis. Therefore, the programmers made the modifications required in each validation until generating version 5.0 which allows to obtain the information of each sequence in columns and Fasta formats in minutes, for the generation of consensus sequences and phylogenetic analysis. However, the generation of the V6.0 is necessary to complete the optimization of the BioDataToolkit program.
dc.description.degreelevel	Pregrado
dc.description.degreename	Biólogo
dc.format.mimetype	application/pdf
dc.identifier.instname	Universidad Industrial de Santander
dc.identifier.reponame	Universidad Industrial de Santander
dc.identifier.repourl	https://noesis.uis.edu.co
dc.identifier.uri	https://noesis.uis.edu.co/handle/20.500.14071/12714
dc.language.iso	spa
dc.publisher	Universidad Industrial de Santander
dc.publisher.faculty	Facultad de Ciencias
dc.publisher.program	Biología
dc.publisher.school	Escuela de Biología
dc.rights	info:eu-repo/semantics/openAccess
dc.rights.accessrights	info:eu-repo/semantics/openAccess
dc.rights.coar	http://purl.org/coar/access_right/c_abf2
dc.rights.creativecommons	Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.license	Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject	Virus Influenza A H1N1
dc.subject	Bases De Datos
dc.subject	Bioinformática
dc.subject	Minería De Datos.
dc.subject.keyword	Influenza A H1N1 Virus
dc.subject.keyword	Databases
dc.subject.keyword	Bioinformatics
dc.subject.keyword	Big Data.
dc.title	Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1
dc.title.english	Evaluation of a program for the generation of databases with sequences of the year 2017 of the influenza virus a h1n1 hemagglutinin gene*
dc.type.coar	http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversion	http://purl.org/coar/resource_type/c_7a1f
dc.type.local	Tesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.type

Files

Original bundle

Now showing 1 - 3 of 3

Name:: Carta de autorización.pdf
Size:: 236.14 KB
Format:: Adobe Portable Document Format

Download

Name:: Documento.pdf
Size:: 1.79 MB
Format:: Adobe Portable Document Format

Download

Name:: Nota de proyecto.pdf
Size:: 135.83 KB
Format:: Adobe Portable Document Format

Download

Collections

Biología