Reglas de asociacion aplicadas al analisis de contenido de los tweets sobre enfermedades transmitidas por vectores en santander, colombia

dc.contributor.advisorLamos Diaz, Henry
dc.contributor.advisorRamirez Sierra, Yuly Andrea
dc.contributor.authorRodriguez Angarita, Cristian Eduardo
dc.contributor.authorRojas Mariño, Juan Camilo
dc.date.accessioned2023-04-06T04:07:21Z
dc.date.available2023
dc.date.available2023-04-06T04:07:21Z
dc.date.created2019
dc.date.issued2019
dc.description.abstractLas redes sociales permiten generar gran cantidad de datos que pueden ser procesados por medio de técnicas de minería de datos y de aprendizaje automático para obtener conocimiento de valor y apoyar la toma de decisiones. Twitter a través de la interfaz de programación de aplicaciones, permite extraer efectivamente estos datos y mediante la aplicación de técnicas de representación del texto se proceda a descubrir patrones útiles, novedosos y válidos, por ejemplo, estos datos permiten caracterizar poblaciones con algún brote epidémico durante un tiempo determinado. En esta investigación se aplican algoritmos de clasificación supervisada y modelos de reglas de asociación para el análisis de contenido de los tweets relacionados con información sobre Enfermedades Transmitidas por Vectores (ETV) tanto en Colombia como en el Departamento de Santander. De esta forma, se clasifican los tweets que son publicados por los diferentes usuarios de la red social, con etiquetas de de kernel lineal el que mejor representa los datos, con una exactitud del 90,7%. Posteriormente, se generan las reglas de asociación que cumplan con unos mínimos establecidos de soporte y confianza, para así, extraer y visualizar las relaciones entre los términos relacionados con cada una de las ETV, identificando las palabras que tienden a presentarse principalmente cuando se habla de una enfermedad en específico, con el fin de identificar posibles relaciones que sean de interés para abordar la salud pública de la población. 1
dc.description.abstractenglishSocial networks allow the generation of a large amount of data that can be processed by means of data mining and machine learning techniques to obtain valuable knowledge and support decision-making. Twitter through the application programming interface, allows to extract these data effectively and through the application of techniques of representation of the text it is come to discover useful, novel and valid patterns, for example, these data allow to characterize populations with some epidemic outbreak during a certain time. In this research, supervised classification algorithms and models of association rules are applied to content analysis of tweets related to information on Vector-borne Diseases in both Colombia and the Department of Santander. In this way, the tweets that are published by the different users of the social network are classified, with "valid" or "invalid" labels as appropriate, being the model of Support Vector Machines with linear kernel function the one that best represents the data, with an accuracy of 90.7%. Subsequently, the association rules that comply with established minimum support and confidence are generated, in order to extract and visualize the relationships between the terms related to each of the Vector-borne Diseases, identifying the words that tend to occur mainly when talking about a specific disease, in order to identify possible relationships that are of interest to address the public health of the population. 3
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Industrial
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/13501
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programIngeniería Industrial
dc.publisher.schoolEscuela de Estudios Industriales y Empresariales
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectAprendizaje Automático
dc.subjectReglas De Asociación
dc.subjectMáquinas De Soporte Vectorial
dc.subjectTwitter
dc.subjectEnfermedades Transmitidas Por Vectores.
dc.subject.keywordMachine Learning
dc.subject.keywordAssociation Rules
dc.subject.keywordSupport Vector Machines
dc.subject.keywordTwitter
dc.subject.keywordVector-Borne Diseases.
dc.titleReglas de asociacion aplicadas al analisis de contenido de los tweets sobre enfermedades transmitidas por vectores en santander, colombia
dc.title.englishAssociation rules applied to the content analysis of tweets on vector-borne diseases in santander, colombia*3
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.type
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
719.54 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
3.89 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
625.71 KB
Format:
Adobe Portable Document Format