Logotipo del repositorio

Publicación:
Evaluación de métodos de agrupamiento dbscan y lda para el análisis de contenido de la red social Twitter

dc.contributor.advisorMartinez Quezada, Daniel Orlando
dc.contributor.advisorLamos Diaz, Henry
dc.contributor.authorAriza Pardo, Nicolas
dc.contributor.authorOlarte Sierra, Diana Yamile
dc.date.accessioned2024-03-04T00:43:53Z
dc.date.available2020
dc.date.available2024-03-04T00:43:53Z
dc.date.created2020
dc.date.issued2020
dc.description.abstractEn la actualidad debido al gran volumen de datos que se manejan es importante usar métodos de monitoreo no supervisado que permitan encontrar relaciones entre diferentes temas y se obtenga información valiosa sobre las discusiones que son tendencia. Dicha información tiene aplicaciones en los diferentes sectores de la industria siendo vital en la toma de decisiones estratégicas. En el presente trabajo se hace un análisis a una base de datos de prueba constituida a través de la red social Twitter, estos datos fueron recolectados a lo largo de cinco meses a través de la página oficial en Twitter de la Universidad Industrial de Santander. Se utiliza la herramienta Rstudio del lenguaje de programación R con la cual se realiza el preprocesamiento de los datos y se define el corpus, además se usa el método del codo y se aplican las métricas Griffits2004, CaoJuan2009, Arun2010 y Deveaud2014 para la definición de los parámetros iniciales para la ejecución de los algoritmos usados. Con esto se hace una evaluación de dos de los métodos de agrupamiento, LDA y DBSCAN aplicando el coeficiente de silueta para analizar la calidad y el grado de coherencia de los grupos obtenidos e identificar tendencias y temas relevantes en la información extraída.
dc.description.abstractenglishAt present, due to the large volume of data that is handled, it is important to use unsupervised monitoring methods that allow finding relationships between different topics and obtain valuable information on the discussions that are trending. This information has applications in different sectors of the industry, being vital in making strategic decisions. In this work, an analysis is made of a test database constituted through the social network Twitter, these data were collected over five months through the official Twitter page of the Industrial University of Santander. The Rstudio tool of the R programming language is used with which the data is preprocessed and the corpus is defined, in addition the elbow method is used and the metrics Griffits2004, CaoJuan2009, Arun2010 and Deveaud2014 are applied to define the initial parameters for the execution of the algorithms used. With this, an evaluation of two of the grouping methods, LDA and DBSCAN, is made, applying the silhouette coefficient to analyze the quality and degree of coherence of the groups obtained and identify relevant trends and themes in the information extracted.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Industrial
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/40194
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programIngeniería Industrial
dc.publisher.schoolEscuela de Estudios Industriales y Empresariales
dc.rightshttp://creativecommons.org/licenses/by/4.0/
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0
dc.subjectaprendizaje automático
dc.subjectTwitter
dc.subjectMinería de texto
dc.subjectAgrupamiento
dc.subjectLDA
dc.subjectDBSCAN.
dc.subject.keywordmachine learning
dc.subject.keywordTwitter
dc.subject.keywordData mining
dc.subject.keywordCluster
dc.subject.keywordLDA
dc.subject.keywordDBSCAN.
dc.titleEvaluación de métodos de agrupamiento dbscan y lda para el análisis de contenido de la red social Twitter
dc.title.englishEvaluation of DBSCAN and LDA clustering methods for content analysis of the social network Twitter*.
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.typePublication

Archivos

Bloque original

Mostrando 1 - 3 de 3
Cargando...
Miniatura
Nombre:
Carta de autorización.pdf
Tamaño:
128.62 KB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Documento.pdf
Tamaño:
1.51 MB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Nota de proyecto.pdf
Tamaño:
103.75 KB
Formato:
Adobe Portable Document Format

VIGILADA MINEDUCACIÓN

Ordenanza No. 83 de 1.944 (junio 22)

Carácter académico: Universidad

Notificaciones judiciales: notjudiciales@uis.edu.co 

.

Código SNIES: 1204   Nit: 890.201.213-4

Línea Anticorrupción:  +57 (601) 562 9300 EXT: 3633

Línea transparente: +57 (607) 630 3031