Publicación: Evaluación de métodos de agrupamiento dbscan y lda para el análisis de contenido de la red social Twitter
Portada
Citas bibliográficas
Gestores Bibliográficos
Código QR
Autor corporativo
Recolector de datos
Otros/Desconocido
Director audiovisual
Editor
Fecha
Citación
Título de serie/ reporte/ volumen/ colección
Es Parte de
Resumen
En la actualidad debido al gran volumen de datos que se manejan es importante usar métodos de monitoreo no supervisado que permitan encontrar relaciones entre diferentes temas y se obtenga información valiosa sobre las discusiones que son tendencia. Dicha información tiene aplicaciones en los diferentes sectores de la industria siendo vital en la toma de decisiones estratégicas. En el presente trabajo se hace un análisis a una base de datos de prueba constituida a través de la red social Twitter, estos datos fueron recolectados a lo largo de cinco meses a través de la página oficial en Twitter de la Universidad Industrial de Santander. Se utiliza la herramienta Rstudio del lenguaje de programación R con la cual se realiza el preprocesamiento de los datos y se define el corpus, además se usa el método del codo y se aplican las métricas Griffits2004, CaoJuan2009, Arun2010 y Deveaud2014 para la definición de los parámetros iniciales para la ejecución de los algoritmos usados. Con esto se hace una evaluación de dos de los métodos de agrupamiento, LDA y DBSCAN aplicando el coeficiente de silueta para analizar la calidad y el grado de coherencia de los grupos obtenidos e identificar tendencias y temas relevantes en la información extraída.

PDF
FLIP 
