Publicación: Proceso de expansión de consulta en un meta buscador web basado en co-ocurrencia de términos relevantes y no relevantes - ecweb
| dc.contributor.advisor | Gómez Flórez, Luis Carlos | |
| dc.contributor.advisor | Cobos Lozada, Carlos Alberto | |
| dc.contributor.author | Estévez Mendoza, Eduardo | |
| dc.date.accessioned | 2024-03-03T18:38:27Z | |
| dc.date.available | 2011 | |
| dc.date.available | 2024-03-03T18:38:27Z | |
| dc.date.created | 2011 | |
| dc.date.issued | 2011 | |
| dc.description.abstract | Se ha demostrado que el proceso de expansión de las consultas en el modelo espacio vectorial de representación de documentos en un sistema de recuperación de información, es una técnica útil para mejorar la relevancia medida por la precisión de los resultados entregados a los usuarios, ya que en general reporta mejores niveles de relevancia en los resultados que los obtenidos por otras formas de representación de documentos, como lo son el modelo probabilístico y el modelo booleano que junto con el modelo vectorial son los más destacados. En este documento se presenta un nuevo algoritmo y una variación del mismo para realizar expansión de consultas en un sistema de recuperación de información. Estos algoritmos se basan en una nueva función discreta que define la importancia relativa de un término en una colección de documentos, y en una matriz de co-ocurrencia de términos que representa la relación de términos relevantes y no relevantes, definidos de esta forma por la calificación previa que el usuario le da a los documentos que se le han presentado en consultas anteriores. El algoritmo y su variación se evalúan frente a la búsqueda por similitud de cosenos y el algoritmo de expansión propuesto por Rocchio, obteniendo excelentes resultados sobre la colección de datos CACM (artículos publicados en la revista Communications of the ACM), y la colección de datos LISA (Library & Information Science Abstracts), además se pone a prueba con estudiantes pertenecientes al curso de ingeniería de Sistemas de la Universidad del Cauca. | |
| dc.description.abstractenglish | It has been shown that the process of expanding queries in the vector space model representation of documents in an information retrieval system is a useful technique to improve the relevance measure for the accuracy of the results delivered to users as generally reported higher levels of relevance in the results obtained by other forms of representation of documents, such as the probabilistic model and the Boolean model with the vector model are the most prominent. This paper presents a new algorithm and a variation of the same for query expansion in information retrieval system. These algorithms are based on a new discrete function that defines the relative importance of a term in a document collection, and an array of co-occurrence of terms represents the ratio of relevant and irrelevant terms defined in this way by the pre-qualify the user gives the documents have been presented in previous consultations. The algorithm and its variations are evaluated against the cosine similarity search algorithm and Rocchio proposed expansion, with excellent results on the CACM collection data (articles published in the journal Communications of the ACM), and data collection LISA (Library & Information Science Abstracts) in addition to being tested with students from the Systems Engineering course at the Universidad del Cauca. | |
| dc.description.degreelevel | Pregrado | |
| dc.description.degreename | Ingeniero de Sistemas | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | Universidad Industrial de Santander | |
| dc.identifier.reponame | Universidad Industrial de Santander | |
| dc.identifier.repourl | https://noesis.uis.edu.co | |
| dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/25174 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Industrial de Santander | |
| dc.publisher.faculty | Facultad de Ingenierías Fisicomecánicas | |
| dc.publisher.program | Ingeniería de Sistemas | |
| dc.publisher.school | Escuela de Ingeniería de Sistemas e Informática | |
| dc.rights | http://creativecommons.org/licenses/by/4.0/ | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0 | |
| dc.subject | Expansión de consulta | |
| dc.subject | Rocchio | |
| dc.subject | Término relevante | |
| dc.subject | IDF | |
| dc.subject | Frecuencia invertida de documento | |
| dc.subject | recuperación de información. | |
| dc.subject.keyword | Query expansion | |
| dc.subject.keyword | Rocchio | |
| dc.subject.keyword | Relevant Term | |
| dc.subject.keyword | IDF | |
| dc.subject.keyword | Inverse document | |
| dc.title | Proceso de expansión de consulta en un meta buscador web basado en co-ocurrencia de términos relevantes y no relevantes - ecweb | |
| dc.title.english | Proceso expansion of query process in a web browser-based target co-occurrence of no significant and relevant terms | |
| dc.type.coar | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
| dc.type.hasversion | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
| dspace.entity.type | Publication |
Archivos
Bloque original
1 - 3 de 3
Cargando...
- Nombre:
- Carta de autorización.pdf
- Tamaño:
- 76.97 KB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- Nota de proyecto.pdf
- Tamaño:
- 211.62 KB
- Formato:
- Adobe Portable Document Format
