Título: Extracción de estructura a partir de descripciones textuales botánicas
Autores: Abascal Mena, María del Rocio
Fecha: 1998-12-11
Publicador: CIRIA
Fuente:
Tipo: Electronic Thesis or Dissertation
Tesis
Tema: Ingeniería en Sistemas Computacionales
Machine-readable bibliographic data
Digital libraries
Descripción: El presente proyecto presenta una solución al problema de análisis y edición de textos en un dominio de aplicación específico, así como su inserción a una base de datos. La solución se propone en el contexto de la Biblioteca Digital Florística (FDL), la cual se está desarrollando en el Centro de Informática Botánica del Jardín Botánico de Missouri con la participación del Laboratorio de Tecnologías Interactivas y Cooperativas (ICT) de la Universidad de las Américas Puebla (UDLAP). El objetivo del proyecto FDL es recolectar y publicar información sobre especies de plantas briofitas y vasculares que crecen en diversas regiones, incluyendo la Flora de Norteamérica (FNA), la Flora de China (FOC) y la Flora de Mesoamérica (FM). Sólo en FNA están participando cerca de 800 autores de documentos llamados tratamientos taxonómicos y que representan el elemento de información fundamental de FDL. Cada tratamiento taxonómico contiene una descripción morfológica cuya introducción manual, revisión y edición representa una enorme inversión de tiempo. Esto se debe principalmente a que las descripciones morfológicas, aunque utilizan un lenguaje restringido, no observan un formato fijo, sino que cada descripción contiene un número diferente de características. La solución que se propone demuestra el potencial del uso de una gramática en la determinación de la estructura de la información contenida en un texto determinado dentro de una biblioteca digital. Dado un texto en formato HTML o formato libre el sistema lo analiza para presentárselo al usuario con el fin de su verificación antes de que se actualice la base de datos. Esta transformación es útil también en el proceso de almacenar descripciones morfológicas existentes en una base de datos con un formato preestablecido. El proyecto forma parte de un sistema, más general, de apoyo a los autores de descripciones morfológicas. Con su uso se espera agilizar la construcción de la biblioteca digital además de contribuir a la investigación en el área de extracción de información en una biblioteca digital.
Idioma: Español