Evaluacion de modelos de aprendizaje no supervisado para el analisis de contenido de tweets generados ante un desastre

dc.contributor.advisorLamos Diaz, Henry
dc.contributor.advisorMartinez Quezada, Daniel Orlando
dc.contributor.authorJimenez Piñeros, Nicolas
dc.contributor.authorJimenez Vargas, Remberth Jose
dc.date.accessioned2023-04-06T04:07:22Z
dc.date.available2023
dc.date.available2023-04-06T04:07:22Z
dc.date.created2019
dc.date.issued2019
dc.description.abstractSe entiende como revolución 4.0 a una etapa en la evolución humana hacia la transición de nuevos sistemas que están construidos sobre la infraestructura digital, trayendo consigo retos tecnológicos que podrían ser usados para resolver problemas y mejorar la calidad de vida de muchas personas. Ahora bien, uno de tantos retos en esta revolución industrial, es el aprovechamiento de la gran cantidad de datos que se generan día a día en la red por cuenta de las redes sociales, datos que al ser procesados e interpretados pueden convertirse en una fuente de información clave para la toma de decisiones en diversos campos de estudio. En el presente proyecto de investigación aplicando conceptos de minería de texto, se evalúan dos modelos de aprendizaje no supervisado (K-means y LDA), con el lenguaje de programación R y tomando como caso de estudio un conjunto de tweets generados durante los incendios forestales que se presentaron en California (Estados Unidos) a fecha de 16 de noviembre de 2018, bajo el hashtag #california, se comparan dichos modelos permitiendo además de identificar las diferentes temáticas, características y/o patrones de comportamiento de los usuarios al momento de la ocurrencia del desastre, concluir cuál de estos algoritmos proporciona información más amplia y relevante en el tema de investigación.
dc.description.abstractenglishRevolution 4.0 is understood as a stage in human evolution towards the transition of new systems that are built on digital infrastructure, bringing with it technological challenges that could be used to solve problems and improve the quality of life of many people. Now, one of the many challenges in this industrial revolution is the use of the large amount of data that is generated on a daily basis on the network by social networks like Twitter, Facebook, Instagram, You Tube, LinkedIn etc. Data that, when processed and interpreted, can become a source of key information for decision-making in various fields of study. In the current research, applying concepts of text mining, two unsupervised learning models are evaluated (K - means and Latent Dirichlet Allocation), with the programming language R and using a set of tweets as a case study that were generated on November 16th of 2018 during the wildfires occurred in California (United States) under the hashtag #california, It is aimed to compare those models in addition, to identifying the different themes, characteristics and / or behavior patterns in this database, to conclude which of these algorithms provides more extensive and relevant information in the research topic.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Industrial
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/13507
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programIngeniería Industrial
dc.publisher.schoolEscuela de Estudios Industriales y Empresariales
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectAnálisis De Contenido
dc.subjectClusters
dc.subjectMinería De Datos
dc.subjectAnálisis De Texto
dc.subjectAprendizaje Automático
dc.subjectTwitter
dc.subjectRedes Sociales
dc.subject.keywordContent Analysis
dc.subject.keywordClusters
dc.subject.keywordData Mining
dc.subject.keywordText Analysis
dc.subject.keywordMachine Learning
dc.subject.keywordTwitter
dc.subject.keywordSocial Networks
dc.titleEvaluacion de modelos de aprendizaje no supervisado para el analisis de contenido de tweets generados ante un desastre
dc.title.englishEvaluation of unsupervised learning models for the content analysis of tweets generated in the event of a disaster*
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.type
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
317.12 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
2.59 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
318 KB
Format:
Adobe Portable Document Format