Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1
dc.contributor.advisor | Barrios Hernández, Carlos Jaime | |
dc.contributor.author | Acuña Carvajal, Cristina Isabel | |
dc.date.accessioned | 2023-04-05T03:43:18Z | |
dc.date.available | 2023 | |
dc.date.available | 2023-04-05T03:43:18Z | |
dc.date.created | 2019 | |
dc.date.issued | 2019 | |
dc.description.abstract | En la pandemia de Influenza A H1N1 del 2009, algunos pacientes que presentaban la sintomatología de infección por este virus eran diagnosticados como falsos negativos por la RT-PCR, debido a la ausencia en la polimerización de los genes para la Hemaglutinina (HA), Nucleocápside y las Proteínas de Matriz M1 y M2. Con una base de datos que incluyó todas las secuencias genómicas hasta el año 2010 del virus, generada por 10 personas durante 18 meses, se determinó que el resultado fue debido a procesos evolutivos del genoma viral; por ello, fueron diseñados nuevos cebadores que diagnosticaron la infección en 150 pacientes. Para solucionar los tiempos de construcción de la base de datos, se generó el programa BioDataToolkit v1.0 cuyo objetivo fue obtener del GenBank: la fecha de colección, país, hospedero, organismo, segmento, serotipo, cepa, el número de acceso y el ORF de cada cepa, para ubicarlos por columnas en Excel, para manejar la información en minutos. Sin embargo, el programa no había sido determinado a nivel biológico, lo cual se realizó en esta pasantía con el gen HA del virus de Influenza A H1N1 del 2017. Se determinó que la combinación óptima para obtener la mayoría de las secuencias fue “Influenza a virus 4 segment h1n1 2017 complete CDS”; con ellas, se generó un formato GenBank full que empleó el programa para su análisis. Desde la versión 1.0 se generó la página de Excel, pero la información no permitía análisis biológicos por tanto los programadores realizaron las modificaciones requeridas en cada validación hasta generar la versión 5.0 la cual permite obtener la información de cada secuencia en columnas y los formatos Fasta en minutos, para la generación de secuencias consenso y análisis filogenéticos. Sin embargo, es necesario la generación de la v6.0 para concluir la optimización del programa BioDataToolkit. | |
dc.description.abstractenglish | In the pandemic Influenza A H1N1 of 2009, some patients who had the symptomatology of infection with this virus were diagnosed as negatives false by RT-PCR, due to the absence in polymerization of genes for Hemagglutinin (HA), Nucleocapsid (HA), and matrix proteins M1 and M2. With a database that included all genomic sequences up to the year 2010 of the virus, generated by 10 people for 18 months, it was determined that the result was due to evolutionary processes of the viral genome. Therefore, new primers that diagnosed the infection in 150 patients were designed. In order to solve the construction times of the database, the BioDataToolkit v1.0 program was generated whose objective was to obtain from GenBank: the collection date, country, host country, organism, segment, serotype, strain, the access number and ORF of each strain, to be placed by columns in Excel, to handle the information in minutes. However, the program had not been determined biologically, which was done in this internship with the HA gene of the Influenza A H1N1 virus of 2017. It was determined that the optimal combination to obtain most sequences was "Influenza a virus 4 Segment h1n1 2017 complete CDS"; with them, a full GenBank format was generated that used the program for analysis. Since version 1.0 the Excel page was generated but the information did not allow biological analysis. Therefore, the programmers made the modifications required in each validation until generating version 5.0 which allows to obtain the information of each sequence in columns and Fasta formats in minutes, for the generation of consensus sequences and phylogenetic analysis. However, the generation of the V6.0 is necessary to complete the optimization of the BioDataToolkit program. | |
dc.description.degreelevel | Pregrado | |
dc.description.degreename | Biólogo | |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad Industrial de Santander | |
dc.identifier.reponame | Universidad Industrial de Santander | |
dc.identifier.repourl | https://noesis.uis.edu.co | |
dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/12714 | |
dc.language.iso | spa | |
dc.publisher | Universidad Industrial de Santander | |
dc.publisher.faculty | Facultad de Ciencias | |
dc.publisher.program | Biología | |
dc.publisher.school | Escuela de Biología | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Virus Influenza A H1N1 | |
dc.subject | Bases De Datos | |
dc.subject | Bioinformática | |
dc.subject | Minería De Datos. | |
dc.subject.keyword | Influenza A H1N1 Virus | |
dc.subject.keyword | Databases | |
dc.subject.keyword | Bioinformatics | |
dc.subject.keyword | Big Data. | |
dc.title | Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1 | |
dc.title.english | Evaluation of a program for the generation of databases with sequences of the year 2017 of the influenza virus a h1n1 hemagglutinin gene* | |
dc.type.coar | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
dc.type.hasversion | http://purl.org/coar/resource_type/c_7a1f | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
dspace.entity.type |
Files
Original bundle
1 - 3 of 3
No Thumbnail Available
- Name:
- Carta de autorización.pdf
- Size:
- 236.14 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Nota de proyecto.pdf
- Size:
- 135.83 KB
- Format:
- Adobe Portable Document Format