Descripción: |
Esta comunicación describe la generación automática y la evaluación de conjuntos de
reglas para la desambiguación del sentido de las palabras (DSP) en la traducción automática. El
objetivo principal es identificar reglas de alta calidad que se pueden utilizar como fuentes del
conocimiento en un modelo relacional de DSP. La evaluación fue realizada automáticamente, por
medio de cuatro medidas objetivas (error, cobertura, suporte y novedad), y manualmente, por medio de
un análisis subjetivo del nivel del interés de las mejores reglas según lo precisado por las medidas
objetivas. Han sido seleccionadas 63 reglas que trataban siete verbos altamente ambiguos. La
evaluación también evidenció qué clases de conocimiento fueron utilizadas con eficacia por las reglas
de DSP, que no son siempre iguales aquéllas reveladas por evaluaciones tradicionales de los modelos
completos de DSP. Aunque hayamos realizado experimentos con inglés-portugués, los procedimientos
de generación y evaluación de las reglas se podrían aplicar a cualquier par de lenguas, siempre que un
corpus de ejemplos de desambiguación esté disponible para este par de lenguas. This paper describes the automatic generation and the evaluation of sets of rules for word
sense disambiguation (WSD) in machine translation. The ultimate aim is to identify high-quality rules
that can be used as knowledge sources in a relational WSD model. The evaluation was carried out both
automatically, by means of four objective measures (error, coverage, support and novelty), and
manually, by means of a subjective analysis of the level of interest of the best rules as pointed out by
the objective measures. As a result, we selected 63 rules addressing seven highly ambiguous verbs. The
evaluation also evidenced which kinds of knowledge were effectively used by the WSD rules, which
are not always the same as those revealed by traditional evaluations of complete WSD models.
Although we experimented with English-Portuguese, the rule generation and evaluation procedures
could be applied to any language pair, provided that there is a disambiguation sample corpus for that
language pair. |