Título: XM-tree, un nuevo índice para recuperación de Información en la Web
Autores: Deco, Claudia
Bender, Cristina
Pierángeli, Guillermo
Reyes, Nora Susana
Fecha: 2012-10-09
2007
Publicador: Unversidad Nacional de La Plata
Fuente:

Tipo: Objeto de conferencia
Objeto de conferencia
Tema: metric spaces
similarity searching
m-tree
xm-tree
espacios métricos
búsqueda por similitud
Graph and tree search strategies
Metrics
Search process
Ciencias Informáticas
Informática
Descripción: La Recuperación de Información de la Web es uno más de los problemas de buscar en un conjunto los elementos más cercanos a una consulta dada bajo un cierto criterio de similitud. Es de interés aprovechar las cualidades de los espacios métricos con el objeto de resolver una consulta de manera efectiva y eficiente. En este artículo, se presenta una propuesta de búsqueda utilizando XM-tree que es una extensión del índice M-tree. Este índice permite la inserción dinámica de nuevos datos, reduce los costos de búsqueda con distancias precalculadas y podas, y utiliza una cantidad de espacio tolerable, lo que lo hace apto para el extenso y dinámico entorno Web. La extensión propuesta indexa documentos Web, emplea L2 como distancia de indexado y resuelve las búsquedas aplicando como criterio de similitud la norma L . Se presenta la experimentación que valida los resultados.
Web Information Retrieval is another problem of searching elements of a set which are closest to a given query under a certain similarity criterion. It is of interest to take advantage of metric spaces in order to solve a search in an effective and efficient way. In this article, we present an extension of the M-tree index, called XM-tree, in order to improve search results. This index allows dynamic insertion of new data, reduces search costs using prunings and precalculated distances, and uses a tolerable amount of space, which makes this index apt for the extensive and dynamic Web. The proposed extension indexes Web documents, uses L2 as indexing distance and L as similarity criterion to solve queries. We also present experiments validating the results.
IV Workshop de Ingeniería de Software y Base de Datos
Idioma: Español