Título: A named entity recognition system based on a finite automata acquisition algorithm
Autores: Padró Cirera, Montserrat
Padró Cirera, Lluís
Fecha: 2007-08-24
2007-08-24
2005-09
Publicador: RUA Docencia
Fuente:
Tipo: info:eu-repo/semantics/article
Tema: Reconocimiento de nombres propios
Autómatas de estados finitos
Aprendizaje automático
Named entity recognition
Finite state automaton
Machine learning
Descripción: En este artículo presentamos un nuevo sistema para el reconocimiento de nombres propios en español. Este sistema está basado en el algoritmo CSSR (Causal-States Splitting Reconstruction) (Shalizi and Shalizi, 2004) que aprende un autómata de estados finitos partiendo de datos secuenciales. Los resultados obtenidos son ligeramente peores que los mejores sistemas presentados en la “shared task” del CoNLL 2002, pero dada la simplicidad de los atributos utilizados, estos resultados son realmente prometedores y creemos que pueden ser fácilmente mejorados introduciendo más información al sistema.
In this work, a new Named Entity Recognition system for Spanish is presented. This system is based on Causal-State Splitting Reconstruction algorithm (Shalizi and Shalizi, 2004), which learns a finite automaton from data sequences. The obtained results are slightly below the best systems presented in CoNLL 2002 shared task, though given the simplicity of the used features, they are really promising. Furthermore, we think that these results can be easily improved by introducing more information in the system.
This research is being funded by the Catalan Government Research Department (DURSI), by the Spanish Ministry of Science and Technology (ALIADO TIC2002-04447-C02) and by the European Comission projects: Meaning (IST-2001-34460) and CHIL (IST-2004-506909).
Idioma: Inglés

Artículos similares:

Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio
Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.
10