- Inicio
- Atrás
|
Título: |
XM-tree, un nuevo índice para recuperación de Información en la Web |
Autores: |
Deco, Claudia Bender, Cristina Pierángeli, Guillermo Reyes, Nora Susana |
Fecha: |
2012-10-09 2007 |
Publicador: |
Unversidad Nacional de La Plata |
Fuente: |
|
Tipo: |
Objeto de conferencia Objeto de conferencia |
Tema: |
metric spaces similarity searching m-tree xm-tree espacios métricos búsqueda por similitud Graph and tree search strategies Metrics Search process Ciencias Informáticas Informática |
Descripción: |
La Recuperación de Información de la Web es uno más de los problemas de buscar en un conjunto los elementos más cercanos a una consulta dada bajo un cierto criterio de similitud. Es de interés aprovechar las cualidades de los espacios métricos con el objeto de resolver una consulta de manera efectiva y eficiente. En este artículo, se presenta una propuesta de búsqueda utilizando XM-tree que es una extensión del índice M-tree. Este índice permite la inserción dinámica de nuevos datos, reduce los costos de búsqueda con distancias precalculadas y podas, y utiliza una cantidad de espacio tolerable, lo que lo hace apto para el extenso y dinámico entorno Web. La extensión propuesta indexa documentos Web, emplea L2 como distancia de indexado y resuelve las búsquedas aplicando como criterio de similitud la norma L . Se presenta la experimentación que valida los resultados. Web Information Retrieval is another problem of searching elements of a set which are closest to a given query under a certain similarity criterion. It is of interest to take advantage of metric spaces in order to solve a search in an effective and efficient way. In this article, we present an extension of the M-tree index, called XM-tree, in order to improve search results. This index allows dynamic insertion of new data, reduces search costs using prunings and precalculated distances, and uses a tolerable amount of space, which makes this index apt for the extensive and dynamic Web. The proposed extension indexes Web documents, uses L2 as indexing distance and L as similarity criterion to solve queries. We also present experiments validating the results. IV Workshop de Ingeniería de Software y Base de Datos |
Idioma: |
Español |