Proceso de expansión de consulta en un meta buscador web basado en co-ocurrencia de términos relevantes y no relevantes - ecweb

Cargando...
Miniatura

Fecha

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Industrial de Santander

Resumen

Se ha demostrado que el proceso de expansión de las consultas en el modelo espacio vectorial de representación de documentos en un sistema de recuperación de información, es una técnica útil para mejorar la relevancia medida por la precisión de los resultados entregados a los usuarios, ya que en general reporta mejores niveles de relevancia en los resultados que los obtenidos por otras formas de representación de documentos, como lo son el modelo probabilístico y el modelo booleano que junto con el modelo vectorial son los más destacados. En este documento se presenta un nuevo algoritmo y una variación del mismo para realizar expansión de consultas en un sistema de recuperación de información. Estos algoritmos se basan en una nueva función discreta que define la importancia relativa de un término en una colección de documentos, y en una matriz de co-ocurrencia de términos que representa la relación de términos relevantes y no relevantes, definidos de esta forma por la calificación previa que el usuario le da a los documentos que se le han presentado en consultas anteriores. El algoritmo y su variación se evalúan frente a la búsqueda por similitud de cosenos y el algoritmo de expansión propuesto por Rocchio, obteniendo excelentes resultados sobre la colección de datos CACM (artículos publicados en la revista Communications of the ACM), y la colección de datos LISA (Library & Information Science Abstracts), además se pone a prueba con estudiantes pertenecientes al curso de ingeniería de Sistemas de la Universidad del Cauca.

Descripción

Citación