Reglas de asociacion aplicadas al analisis de contenido de los tweets sobre enfermedades transmitidas por vectores en santander, colombia

No Thumbnail Available
Date
2019
Evaluators
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Industrial de Santander
Abstract
Las redes sociales permiten generar gran cantidad de datos que pueden ser procesados por medio de técnicas de minería de datos y de aprendizaje automático para obtener conocimiento de valor y apoyar la toma de decisiones. Twitter a través de la interfaz de programación de aplicaciones, permite extraer efectivamente estos datos y mediante la aplicación de técnicas de representación del texto se proceda a descubrir patrones útiles, novedosos y válidos, por ejemplo, estos datos permiten caracterizar poblaciones con algún brote epidémico durante un tiempo determinado. En esta investigación se aplican algoritmos de clasificación supervisada y modelos de reglas de asociación para el análisis de contenido de los tweets relacionados con información sobre Enfermedades Transmitidas por Vectores (ETV) tanto en Colombia como en el Departamento de Santander. De esta forma, se clasifican los tweets que son publicados por los diferentes usuarios de la red social, con etiquetas de de kernel lineal el que mejor representa los datos, con una exactitud del 90,7%. Posteriormente, se generan las reglas de asociación que cumplan con unos mínimos establecidos de soporte y confianza, para así, extraer y visualizar las relaciones entre los términos relacionados con cada una de las ETV, identificando las palabras que tienden a presentarse principalmente cuando se habla de una enfermedad en específico, con el fin de identificar posibles relaciones que sean de interés para abordar la salud pública de la población. 1
Description
Keywords
Aprendizaje Automático, Reglas De Asociación, Máquinas De Soporte Vectorial, Twitter, Enfermedades Transmitidas Por Vectores.
Citation