Título: Generación automática de una base de datos desde documentos de la web
Autores: Motz, Regina
Wonsever, Dina
Perelló, Fernando
Ferreiro, Jaime
Fecha: 2012-11-02
2000-10
2000-10
Publicador: Unversidad Nacional de La Plata
Fuente:

Tipo: Objeto de conferencia
Objeto de conferencia
Tema: documento HTML
mapeo
extracción de información
Ciencias Informáticas
Base de Datos
Descripción: El objetivo central de este trabajo es la extracción de información de documentos HTML y la consolidación de esta información en una base de datos. Se propone un mecanismo basado en una ontología del dominio, en patrones sintácticos típicos para la inferencia de algunos tipos de datos y en heurísticas para la interpretación de títulos y tablas. Mediante este mecanismo se construye automáticamente un mapeo entre elementos de un documento HTML y las entidades del dominio del usuario. Utilizando este mapeo, se transfiere la información extraída de la página Web a una base de datos local.
Área: Ingeniería de Software - Bases de Datos
Idioma: Español