Título: Criterios de búsqueda y extractores de datos aplicados en los portales de bibliotecas digitales BTC y BDBComp
Autores: Vargas, Luis Alejandro
Laender, Alberto
Montejano, Germán Antonio
Fecha: 2012-08-23
2011-05
2011
Publicador: Unversidad Nacional de La Plata
Fuente:

Tipo: Objeto de conferencia
Objeto de conferencia
Tema: biblioteca digital
extracción de datos
wrapper
Data mining
Ciencias Informáticas
base de datos
Descripción: En la Web encontramos que la información crece constantemente y parte de ella está disponible a través de servicios especializados de Bibliotecas Digitales. Efectuar búsquedas en cada uno de los portales de Bibliotecas Digitales consumiría bastante tiempo, por la cual nos encontramos con el inconveniente de disponer de toda esa información en el instante que la necesitamos o la precisamos. Concentrar la información proveniente de diferentes fuentes de datos, obviamente, relativas a una misma área de interés, beneficiaria en la búsqueda de información en la que el usuario está interesado. Proponemos desarrollar extractores de datos que hagan uso de los criterios de búsqueda que el usuario introduce en el portal BTC (BTC Biblioteca de Trabajos Científicos, portal desarrollado por la Facultad de Ingeniería, UNJu, Argentina), aplicarlos en el portal BDBComp (DBDComp Biblioteca Digital Brasileira de Computacão desarrollado por el Departamento de Ciencia da Computacão, UFMG, Brasil), y así lograr obtener los datos-resultados de diferentes páginas. Los criterios de búsqueda son ingresados en cualquier de los siguientes idiomas: español, portugués e inglés, en el portal BTC, y la traducción se efectúa via ONLINE a otros idiomas mediante Google Translator, donde también aplicaremos el concepto de extracción de datos. Dichos procesos son llevados a cabo en forma transparente para el usuario que efectúa la consulta. Los resultados son formateados, clasificados según el idioma de escritura y visualizados mediante archivos XML dentro del portal BTC, sitio donde se va a concentrar la información.
Eje: Bases de datos y minería de datos
Idioma: Español