Título: Implementación de un digesto digital paralelo para búsquedas por similitud sobre documentos
Autores: Solar, Roberto
Uribe Paredes, Roberto
Gesto, Esteban
Osiris, Sofía
Fecha: 2012-10-03
2008-10
2008
Publicador: Unversidad Nacional de La Plata
Fuente:

Tipo: Objeto de conferencia
Objeto de conferencia
Tema: consultas por similaridad
modelo BSP
similitary search
Algorithms
Parallel processing
Ciencias Informáticas
Base de Datos
Algoritmos
Descripción: La búsqueda por similitud consiste en recuperar todos aquellos objetos dentro de una base de datos que sean parecidos o relevantes a una determinada consulta. Este concepto tiene una amplia gama de aplicaciones en áreas como bases de datos multimedia, reconocimiento de patrones, minería de datos, recuperación de información, etc. La necesidad de procesar grandes volúmenes de datos y de poner a disposición de los usuarios respuestas rápidas a sus consultas hace que las estructuras que soportan este tipo de búsquedas deban ser paralelizadas. Por otro lado, la cantidad de información generada por instituciones públicas y privadas y la necesidad de recuperar documentos de formas más complejas, permite la unión de las áreas de paralelismo y búsqueda por similitud en una aplicación real. El presente artículo presenta un solución eficiente y de bajo costo de un motor de búsqueda paralelo, presentando una alternativa para consultas en un Digesto Digital Institucional, la búsqueda de documentos por similitud.
Similarity search consists in retrieving those objects within a database that are alike or relevant in a given query. This concept has a broad range of applications in diverse areas such as multimedia database, pattern recognition, data mining, information retrieval, etc. The necessity to process large amounts of data to find fast answers to queries makes the structures that support this system parallel. Besides, the quantity of information generated by public and private institutions and the need to recuperate documents in a much more complex way allows for the union of parallel and similarity search areas to makes a real application. This article presents an efficient solution with a low cost parallel search engine as an alternative to queries in an Institutional Digital Digest, document search by similitude.
Workshop de Ingeniería de Software y Bases de Datos (WISBD)
Idioma: Español