Título: Aplicación de técnicas de extracción de información en bibliotecas digitales
Autores: Bia Platas, Alejandro
Muñoz Guillena, Rafael
Fecha: 2007-09-25
2007-09-25
2000-09
Publicador: RUA Docencia
Fuente:
Tipo: info:eu-repo/semantics/article
Tema: Extracción de información
Bibliotecas digitales
HTML
Descripción: Con frecuencia, las Bibliotecas Digitales tienen la necesidad de extraer información a partir de documentos pobremente marcados para almacenarla en bases de datos o crear nuevos documentos hipertexto con un marcado altamente estructurado. En este trabajo, abordaremos el problema de extraer información bibliográfica a partir de informes literarios en formato HTML para alimentar una base de datos de publicaciones gallegas de una Biblioteca Digital para ser consultada a través de Internet. Para este fin se ha utilizado con éxito una metodología que aprovecha la información contenida en las marcas HTML y que a su vez aplica técnicas de Procesamiento del Lenguaje Natural (PLN).
Idioma: Español

Artículos similares:

Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio
Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.
10