Título: Exploiting rules for word sense disambiguation in machine translation
Autores: Specia, Lucia
Nunes, Maria das Graças Volpe
Stevenson, Mark
Fecha: 2007-08-22
2007-08-22
2005-09
Publicador: RUA Docencia
Fuente:
Tipo: info:eu-repo/semantics/article
Tema: Desambiguación del sentido de las palabras
Aprendizaje de máquina
Evaluación de reglas
Word sense disambiguation
Machine learning
Rule evaluation
Descripción: Esta comunicación describe la generación automática y la evaluación de conjuntos de reglas para la desambiguación del sentido de las palabras (DSP) en la traducción automática. El objetivo principal es identificar reglas de alta calidad que se pueden utilizar como fuentes del conocimiento en un modelo relacional de DSP. La evaluación fue realizada automáticamente, por medio de cuatro medidas objetivas (error, cobertura, suporte y novedad), y manualmente, por medio de un análisis subjetivo del nivel del interés de las mejores reglas según lo precisado por las medidas objetivas. Han sido seleccionadas 63 reglas que trataban siete verbos altamente ambiguos. La evaluación también evidenció qué clases de conocimiento fueron utilizadas con eficacia por las reglas de DSP, que no son siempre iguales aquéllas reveladas por evaluaciones tradicionales de los modelos completos de DSP. Aunque hayamos realizado experimentos con inglés-portugués, los procedimientos de generación y evaluación de las reglas se podrían aplicar a cualquier par de lenguas, siempre que un corpus de ejemplos de desambiguación esté disponible para este par de lenguas.
This paper describes the automatic generation and the evaluation of sets of rules for word sense disambiguation (WSD) in machine translation. The ultimate aim is to identify high-quality rules that can be used as knowledge sources in a relational WSD model. The evaluation was carried out both automatically, by means of four objective measures (error, coverage, support and novelty), and manually, by means of a subjective analysis of the level of interest of the best rules as pointed out by the objective measures. As a result, we selected 63 rules addressing seven highly ambiguous verbs. The evaluation also evidenced which kinds of knowledge were effectively used by the WSD rules, which are not always the same as those revealed by traditional evaluations of complete WSD models. Although we experimented with English-Portuguese, the rule generation and evaluation procedures could be applied to any language pair, provided that there is a disambiguation sample corpus for that language pair.
Idioma: Inglés

Artículos similares:

Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio
Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.
10