Título: Desambiguación léxica mediante marcas de especificidad
Autores: Montoyo Guijarro, Andrés
Fecha: 2007-09-21
2007-09-21
2002-05
Publicador: RUA Docencia
Fuente:
Tipo: info:eu-repo/semantics/article
Tema: Ambigüedad léxica
Word sense disambiguation
WordNet
Enriquecimiento de WordNet semánticamente
Sistemas de clasificación
Lexical ambiguity
WordNet enrichment
Classification systems
Descripción: Esta tesis presenta un método para resolver la ambigüedad léxica pura (semántica) en textos de dominios no registrados en cualquier lengua que tenga un repositorio de sentidos organizado como una base de conocimiento léxica. A este método de resolución de la ambigüedad léxica pura propuesto se denomina Método de Marcas de Especificidad y se basa en el uso de conocimiento lingüístico (información léxica y morfológica) y de conocimiento a partir de las relaciones léxicas y semánticas de la taxonomía de nombres de la base de conocimiento léxica WordNet. Además, se presenta la aplicación del método de Marcas de Especificidad con el objetivo de enriquecer semánticamente WordNet con etiquetas de dominio o categorías de otros sistemas de clasificación.
This thesis presents a method for the automatic disambiguating of nouns, using the notion of Specification Marks and employing the noun taxonomy of the WordNet lexical knowledge base. The method resolves the lexical ambiguity of nouns in any sort of text, and although it relies on the semantic relations (Hypernymy and Hyponymy) and the hierarchic organization of WordNet, it does not, however, require any sort of training process, no hand-coding of lexical entries, nor the hand-tagging of texts. Besides, this thesis presents a new method to enrich semantically WordNet with categories from general domain classification systems. The method is performed in two consecutive steps. First, a lexical knowledge word sense disambiguation process. Second, a set of rules to select the main concepts as representatives of each category. The method has been applied to label automatically WordNet synsets with Subject Codes from a standard news agencies classification system.
Directores de la tesis: Manuel Palomar Sanz (Universidad de Alicante) y German Rigau Claramunt (Universitat Politècnica de Catalunya)
Esta investigación ha sido parcialmente financiada por el Ministerio de Ciencia y Tecnología a través del proyecto TIC2000-0664-C02-01/02.
Idioma: Español

Artículos similares:

Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio
Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.
10