Logotipo del repositorio

Publicación:
Análisis de sentimiento de los comentarios en TripAdvisor: un caso de los hoteles de Bucaramanga

dc.contributor.advisorRamírez Sierra, Yuly Andrea
dc.contributor.authorDíaz Pinzón, Ángela María
dc.contributor.evaluatorMosquera Navarro, Rodolfo
dc.contributor.evaluatorEstupinan Ojeda, Diego Fabian
dc.date.accessioned2024-05-22T12:31:07Z
dc.date.available2024-05-22T12:31:07Z
dc.date.created2024-05-21
dc.date.issued2024-05-21
dc.description.abstractEl análisis de sentimiento es una herramienta utilizada en el Procesamiento de Lenguaje Natural (PLN) para identificar el sentimiento o la emoción expresada en un texto. Es ampliamente utilizada para analizar el contenido generado por usuarios en diferentes campos. En este trabajo, se explora la aplicación del análisis de sentimiento en español al sector hotelero en la ciudad de Bucaramanga, extrayendo reseñas de seis de los hoteles mejor clasificados en TripAdvisor. Se trabaja con 350 reseñas, clasificándolas en tres polaridades: positivo, neutro y negativo, y separando cada reseña en dos componentes, los títulos y los contenidos. Se realiza el proceso de etiquetado manualmente y se toma como referencia para comparar con dos librerías multilenguaje, VADER y Pysentimiento, así como con un modelo pre entrenado basado en la arquitectura de transformadores, BERT, utilizando la validación cruzada para probar los hiper parámetros. Al comparar las dos librerías, se concluye que Pysentimiento funciona mejor para el problema de clasificación presentado. Con este resultado, se propone un esquema para el preprocesamiento de los datos, realizando combinaciones entre los pasos para medir la precisión, el recall y el F1-score de Pysentimiento. Se halla que, tanto para el escenario de los títulos como de los contenidos, funcionó mejor al aplicar uno de los pasos del preprocesamiento al conjunto de datos. Se entrena el modelo BERT y se obtienen resultados deficientes debido al tamaño del conjunto de datos y las clases desbalanceadas. Finalmente un análisis para generar recomendaciones a los hoteles estudiados con base en los bigramas más frecuentes en cada polaridad detectada.
dc.description.abstractenglishSentiment analysis is a tool used in Natural Language Processing (NLP) to identify the sentiment or emotion expressed in a text. It is widely used to analyze user-generated content in different fields. In this work, we explore the application of sentiment analysis in Spanish to the hotel sector in the city of Bucaramanga, extracting reviews from six of the top-rated hotels on TripAdvisor. We work with 350 reviews, classifying them into three polarities: positive, neutral, and negative, and separating each review into two components, titles and contents. The manual labeling process is carried out and used as a reference for comparison with two multilanguage libraries, VADER and Pysentimiento, as well as with a pretrained model based on the transformer architecture, BERT, using cross validation to test the hyperparameters. When comparing the two libraries, it is concluded that Pysentimiento performs better for the classification problem presented. With this result, a scheme for data preprocessing is proposed, performing combinations between the steps to measure the precision, recall, and F1-score of Pysentimiento. It is found that, both for the titles and contents scenarios, it worked better to apply one of the preprocessing steps to the dataset. The BERT model is trained, and poor results are obtained due to the size of the dataset and the imbalanced classes. Finally, an analysis is conducted to generate recommendations to the studied hotels based on the most frequent bigrams in each detected polarity.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Industrial
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/42523
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingeníerias Fisicomecánicas
dc.publisher.programIngeniería Industrial
dc.publisher.schoolEscuela de Estudios Industriales y Empresariales
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAtribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectAnálisis de sentimiento
dc.subjectturismo Bucaramanga
dc.subjecthotelería Bucaramanga
dc.subjectminería de texto
dc.subjectcomentarios en línea
dc.subject.keywordSentiment analysis
dc.subject.keywordBucaramanga tourism
dc.subject.keywordBucaramanga hotel
dc.subject.keywordtext mining
dc.subject.keywordonline reviews
dc.titleAnálisis de sentimiento de los comentarios en TripAdvisor: un caso de los hoteles de Bucaramanga
dc.title.englishSentiment analysis of TripAdvisor reviews: a case of Bucaramanga hotels
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.typePublication

Archivos

Bloque original

Mostrando 1 - 5 de 9
Cargando...
Miniatura
Nombre:
Documento .pdf
Tamaño:
2.44 MB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Nota de Proyecto.pdf
Tamaño:
268.48 KB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Carta de Autorización.pdf
Tamaño:
99.39 KB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Apéndice A.xlsx
Tamaño:
16.15 KB
Formato:
Microsoft Excel XML
Cargando...
Miniatura
Nombre:
Apéndice B.xlsx
Tamaño:
14.05 KB
Formato:
Microsoft Excel XML

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
2.18 KB
Formato:
Item-specific license agreed to upon submission
Descripción:

VIGILADA MINEDUCACIÓN

Ordenanza No. 83 de 1.944 (junio 22)

Carácter académico: Universidad

Notificaciones judiciales: notjudiciales@uis.edu.co 

.

Código SNIES: 1204   Nit: 890.201.213-4

Línea Anticorrupción:  +57 (601) 562 9300 EXT: 3633

Línea transparente: +57 (607) 630 3031