Descripción: |
El presente proyecto presenta una solución al problema de análisis
y edición de textos en un dominio de aplicación específico,
así como su inserción a una base de datos. La solución
se propone en el contexto de la Biblioteca Digital Florística (FDL),
la cual se está desarrollando en el Centro de Informática
Botánica del Jardín Botánico de Missouri con la
participación del Laboratorio de Tecnologías Interactivas y
Cooperativas (ICT) de la Universidad de las Américas Puebla (UDLAP).
El objetivo del proyecto FDL es recolectar y publicar información
sobre especies de plantas briofitas y vasculares que crecen en diversas regiones,
incluyendo la Flora de Norteamérica (FNA), la Flora de China (FOC)
y la Flora de Mesoamérica (FM). Sólo en FNA están
participando cerca de 800 autores de documentos llamados tratamientos
taxonómicos y que representan el elemento de información
fundamental de FDL.
Cada tratamiento taxonómico contiene una descripción
morfológica cuya introducción manual, revisión y
edición representa una enorme inversión de tiempo. Esto se
debe principalmente a que las descripciones morfológicas, aunque utilizan
un lenguaje restringido, no observan un formato fijo, sino que cada
descripción contiene un número diferente de características.
La solución que se propone demuestra el potencial del uso de una
gramática en la determinación de la estructura de la
información contenida en un texto determinado dentro de una biblioteca
digital. Dado un texto en formato HTML o formato libre el sistema lo analiza
para presentárselo al usuario con el fin de su verificación
antes de que se actualice la base de datos. Esta transformación es
útil también en el proceso de almacenar descripciones
morfológicas existentes en una base de datos con un formato
preestablecido.
El proyecto forma parte de un sistema, más general, de apoyo a los
autores de descripciones morfológicas. Con su uso se espera agilizar
la construcción de la biblioteca digital además de contribuir
a la investigación en el área de extracción de
información en una biblioteca digital. |