Título: Integrando una base de datos léxica y una colección de entrenamiento para la desambiguación del sentido de las palabras
Autores: Ureña López, Luis Alfonso
Gómez Hidalgo, José María
García Vega, Manuel
Díaz Esteban, Alberto
Fecha: 2007-10-03
2007-10-03
1998-09
Publicador: RUA Docencia
Fuente:
Tipo: info:eu-repo/semantics/article
Tema: Desambiguación del sentido de las palabras
Categorización de texto
WordNet
SemCor
Recuperación de información
Traducción automática
Ventana contextual
Descripción: La resolución de la ambigüedad es una tarea compleja y útil para muchas aplicaciones del procesamiento del lenguaje natural. En concreto, la ambigüedad causa problemas en aplicaciones como: la Recuperación de Información (IR), donde los problemas pueden ser substanciales y ser superados si se utilizan grandes consultas, y la traducción automática, donde es un gran problema inherente. Recientemente han sido varios los enfoques y algoritmos propuestos para realizar esta tarea. Presentamos un nuevo enfoque basado en la integración de varios recursos lingüísticos de dominio público, como una base de datos léxica y una colección de entrenamiento. Nuestro enfoque integra la información de sinonimia de WordNet y la colección de entrenamiento SemCor para incrementar la efectividad de la desambiguación, a través del Modelo del Espacio Vectorial. Hemos probado nuestro enfoque sobre un gran conjunto de documentos con una fina granularidad de sentidos, como son los de WordNet, consiguiendo una alta precisión en la resolución de la ambigüedad léxica.
Idioma: Español

Artículos similares:

Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio
Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.
10