Reglas de asociacion aplicadas al analisis de contenido de los tweets sobre enfermedades transmitidas por vectores en santander, colombia
dc.contributor.advisor | Lamos Diaz, Henry | |
dc.contributor.advisor | Ramirez Sierra, Yuly Andrea | |
dc.contributor.author | Rodriguez Angarita, Cristian Eduardo | |
dc.contributor.author | Rojas Mariño, Juan Camilo | |
dc.date.accessioned | 2023-04-06T04:07:21Z | |
dc.date.available | 2023 | |
dc.date.available | 2023-04-06T04:07:21Z | |
dc.date.created | 2019 | |
dc.date.issued | 2019 | |
dc.description.abstract | Las redes sociales permiten generar gran cantidad de datos que pueden ser procesados por medio de técnicas de minería de datos y de aprendizaje automático para obtener conocimiento de valor y apoyar la toma de decisiones. Twitter a través de la interfaz de programación de aplicaciones, permite extraer efectivamente estos datos y mediante la aplicación de técnicas de representación del texto se proceda a descubrir patrones útiles, novedosos y válidos, por ejemplo, estos datos permiten caracterizar poblaciones con algún brote epidémico durante un tiempo determinado. En esta investigación se aplican algoritmos de clasificación supervisada y modelos de reglas de asociación para el análisis de contenido de los tweets relacionados con información sobre Enfermedades Transmitidas por Vectores (ETV) tanto en Colombia como en el Departamento de Santander. De esta forma, se clasifican los tweets que son publicados por los diferentes usuarios de la red social, con etiquetas de de kernel lineal el que mejor representa los datos, con una exactitud del 90,7%. Posteriormente, se generan las reglas de asociación que cumplan con unos mínimos establecidos de soporte y confianza, para así, extraer y visualizar las relaciones entre los términos relacionados con cada una de las ETV, identificando las palabras que tienden a presentarse principalmente cuando se habla de una enfermedad en específico, con el fin de identificar posibles relaciones que sean de interés para abordar la salud pública de la población. 1 | |
dc.description.abstractenglish | Social networks allow the generation of a large amount of data that can be processed by means of data mining and machine learning techniques to obtain valuable knowledge and support decision-making. Twitter through the application programming interface, allows to extract these data effectively and through the application of techniques of representation of the text it is come to discover useful, novel and valid patterns, for example, these data allow to characterize populations with some epidemic outbreak during a certain time. In this research, supervised classification algorithms and models of association rules are applied to content analysis of tweets related to information on Vector-borne Diseases in both Colombia and the Department of Santander. In this way, the tweets that are published by the different users of the social network are classified, with "valid" or "invalid" labels as appropriate, being the model of Support Vector Machines with linear kernel function the one that best represents the data, with an accuracy of 90.7%. Subsequently, the association rules that comply with established minimum support and confidence are generated, in order to extract and visualize the relationships between the terms related to each of the Vector-borne Diseases, identifying the words that tend to occur mainly when talking about a specific disease, in order to identify possible relationships that are of interest to address the public health of the population. 3 | |
dc.description.degreelevel | Pregrado | |
dc.description.degreename | Ingeniero Industrial | |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad Industrial de Santander | |
dc.identifier.reponame | Universidad Industrial de Santander | |
dc.identifier.repourl | https://noesis.uis.edu.co | |
dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/13501 | |
dc.language.iso | spa | |
dc.publisher | Universidad Industrial de Santander | |
dc.publisher.faculty | Facultad de Ingenierías Fisicomecánicas | |
dc.publisher.program | Ingeniería Industrial | |
dc.publisher.school | Escuela de Estudios Industriales y Empresariales | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Aprendizaje Automático | |
dc.subject | Reglas De Asociación | |
dc.subject | Máquinas De Soporte Vectorial | |
dc.subject | ||
dc.subject | Enfermedades Transmitidas Por Vectores. | |
dc.subject.keyword | Machine Learning | |
dc.subject.keyword | Association Rules | |
dc.subject.keyword | Support Vector Machines | |
dc.subject.keyword | ||
dc.subject.keyword | Vector-Borne Diseases. | |
dc.title | Reglas de asociacion aplicadas al analisis de contenido de los tweets sobre enfermedades transmitidas por vectores en santander, colombia | |
dc.title.english | Association rules applied to the content analysis of tweets on vector-borne diseases in santander, colombia*3 | |
dc.type.coar | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
dc.type.hasversion | http://purl.org/coar/resource_type/c_7a1f | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
dspace.entity.type |
Files
Original bundle
1 - 3 of 3
No Thumbnail Available
- Name:
- Carta de autorización.pdf
- Size:
- 719.54 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Nota de proyecto.pdf
- Size:
- 625.71 KB
- Format:
- Adobe Portable Document Format