Logotipo del repositorio

Publicación:
Proceso de expansión de consulta en un meta buscador web basado en co-ocurrencia de términos relevantes y no relevantes - ecweb

dc.contributor.advisorGómez Flórez, Luis Carlos
dc.contributor.advisorCobos Lozada, Carlos Alberto
dc.contributor.authorEstévez Mendoza, Eduardo
dc.date.accessioned2024-03-03T18:38:27Z
dc.date.available2011
dc.date.available2024-03-03T18:38:27Z
dc.date.created2011
dc.date.issued2011
dc.description.abstractSe ha demostrado que el proceso de expansión de las consultas en el modelo espacio vectorial de representación de documentos en un sistema de recuperación de información, es una técnica útil para mejorar la relevancia medida por la precisión de los resultados entregados a los usuarios, ya que en general reporta mejores niveles de relevancia en los resultados que los obtenidos por otras formas de representación de documentos, como lo son el modelo probabilístico y el modelo booleano que junto con el modelo vectorial son los más destacados. En este documento se presenta un nuevo algoritmo y una variación del mismo para realizar expansión de consultas en un sistema de recuperación de información. Estos algoritmos se basan en una nueva función discreta que define la importancia relativa de un término en una colección de documentos, y en una matriz de co-ocurrencia de términos que representa la relación de términos relevantes y no relevantes, definidos de esta forma por la calificación previa que el usuario le da a los documentos que se le han presentado en consultas anteriores. El algoritmo y su variación se evalúan frente a la búsqueda por similitud de cosenos y el algoritmo de expansión propuesto por Rocchio, obteniendo excelentes resultados sobre la colección de datos CACM (artículos publicados en la revista Communications of the ACM), y la colección de datos LISA (Library & Information Science Abstracts), además se pone a prueba con estudiantes pertenecientes al curso de ingeniería de Sistemas de la Universidad del Cauca.
dc.description.abstractenglishIt has been shown that the process of expanding queries in the vector space model representation of documents in an information retrieval system is a useful technique to improve the relevance measure for the accuracy of the results delivered to users as generally reported higher levels of relevance in the results obtained by other forms of representation of documents, such as the probabilistic model and the Boolean model with the vector model are the most prominent. This paper presents a new algorithm and a variation of the same for query expansion in information retrieval system. These algorithms are based on a new discrete function that defines the relative importance of a term in a document collection, and an array of co-occurrence of terms represents the ratio of relevant and irrelevant terms defined in this way by the pre-qualify the user gives the documents have been presented in previous consultations. The algorithm and its variations are evaluated against the cosine similarity search algorithm and Rocchio proposed expansion, with excellent results on the CACM collection data (articles published in the journal Communications of the ACM), and data collection LISA (Library & Information Science Abstracts) in addition to being tested with students from the Systems Engineering course at the Universidad del Cauca.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero de Sistemas
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/25174
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programIngeniería de Sistemas
dc.publisher.schoolEscuela de Ingeniería de Sistemas e Informática
dc.rightshttp://creativecommons.org/licenses/by/4.0/
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0
dc.subjectExpansión de consulta
dc.subjectRocchio
dc.subjectTérmino relevante
dc.subjectIDF
dc.subjectFrecuencia invertida de documento
dc.subjectrecuperación de información.
dc.subject.keywordQuery expansion
dc.subject.keywordRocchio
dc.subject.keywordRelevant Term
dc.subject.keywordIDF
dc.subject.keywordInverse document
dc.titleProceso de expansión de consulta en un meta buscador web basado en co-ocurrencia de términos relevantes y no relevantes - ecweb
dc.title.englishProceso expansion of query process in a web browser-based target co-occurrence of no significant and relevant terms
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.typePublication

Archivos

Bloque original

Mostrando 1 - 3 de 3
Cargando...
Miniatura
Nombre:
Carta de autorización.pdf
Tamaño:
76.97 KB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Documento.pdf
Tamaño:
2.3 MB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
Nota de proyecto.pdf
Tamaño:
211.62 KB
Formato:
Adobe Portable Document Format

VIGILADA MINEDUCACIÓN

Ordenanza No. 83 de 1.944 (junio 22)

Carácter académico: Universidad

Notificaciones judiciales: notjudiciales@uis.edu.co 

.

Código SNIES: 1204   Nit: 890.201.213-4

Línea Anticorrupción:  +57 (601) 562 9300 EXT: 3633

Línea transparente: +57 (607) 630 3031