Título: Representación en memoria secundaria del trie de sufijos
Autores: Ruano, Darío
Herrera, Norma Edith
Ruano, Carina
Villegas, Ana
Fecha: 2012-08-08
2010-10
2010
Publicador: Unversidad Nacional de La Plata
Fuente:

Tipo: Objeto de conferencia
Objeto de conferencia
Tema: Bases de Datos de Texto
Índices
Memoria Secundaria
Trie
Data mining
Ciencias Informáticas
Base de Datos
Descripción: Mientras que en bases de datos tradicionales los índices ocupan menos espacio que el conjunto de datos indexados, en bases de datos de texto el índice ocupa más espacio que el texto en sí mismo, pudiendo necesitar de 4 a 20 veces el tamaño del mismo. Esto implica que un índice construido sobre una base de datos de texto residirá en memoria secundaria y en consecuencia la cantidad de accesos a disco realizados durante el proceso de búsqueda será un factor crítico en la performance del mismo. Un trie de sufijos es un índice para este tipo de bases de datos que necesita en espacio 10 veces el tamaño del texto indexado. Si bien existen algoritmos de construcción de un trie de sufijos en memoria secundaria, no se conocen algoritmos para paginar dicho índice. En este artículo presentamos una propuesta de representación de un trie de sufijos y una técnica de paginado del mismo.
Presentado en el VII Workshop Bases de Datos y Minería de Datos (WBD)
Idioma: Español