Título: The Tibidabo treebank
El treebank Tibidabo
Autores: Marimon Felipe, Montserrat
Fecha: 2010-10-11
2010-10-11
2010-10
Publicador: RUA Docencia
Fuente:
Tipo: info:eu-repo/semantics/article
Tema: Treebank
Lengua española
HPSG
Spanish language
Lenguajes y Sistemas Informáticos
Descripción: En este artículo presentamos el desarrollo de un nuevo recurso de código abierto para el español: el treebank Tibidabo. La anotación se está llevando a cabo de forma semi–automática en la que, en primer lugar, el corpus es analizado automáticamente con una gramática simbólica del español basada en HPSG e implementada en el sistema Linguistic Knowledge Builder, y, en segundo lugar, los resultados del proceso de análisis se desambiguan manualmente. La existencia del treebank Tibidabo nos permitirá futuros trabajos de investigación para el desarrollo y evaluación de una arquitectura híbrida que combine metodos simbólicos y estadísticos para el PLN, así como investigaciones orientadas a la hibridización de técnicas de bajo y alto nivel para el PLN.
This paper describes work in progress for the creation of a new open–source resource for Spanish: an HPSG–based treebank so–called Tibidabo. The annotation is performed semi–automatically. First, the corpus is automatically annotated by a symbolic HPSG–based grammar for Spanish implemented on the Linguistic Knowledge Builder system; then, the output is manually disambiguated. The existence of the Tibidabo treebank will facilitate research into the development and evaluation of a hybrid architecture combining symbolic and stochastic approaches to NLP, as well as investigations oriented to hybridization of shallow–deep techniques for NLP.
This work was funded by the Ramón y Cajal program of the Spanish Ministerio de Ciencia e Innovación.
Idioma: Inglés

Artículos similares:

Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio
Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.
10