Título: Contribución de la información semántica en un sistema de aprendizaje automático para resolver la implicación textual
Autores: Vázquez Pérez, Sonia
Kozareva, Zornitsa Petrova
Montoyo Guijarro, Andrés
Fecha: 2007-11-26
2007-11-26
2006-09
Publicador: RUA Docencia
Fuente:
Tipo: info:eu-repo/semantics/article
Tema: Implicación textual
Semántica latente
Aprendizaje automático
Textual entailment
Latent semantic indexing
Machine learning
Descripción: La forma en que podemos expresar un mismo pensamiento puede variar dependiendo de las circunstancias, del objetivo que pretendemos alcanzar, etc. Esta variabilidad del lenguaje se convierte en un problema cuando una aplicación de procesamiento del lenguaje natural intenta extraer el mismo contenido semántico a partir de dos construcciones distintas. Para resolver este problema se ha creado una tarea denominada ”Reconocimiento de Implicación Textual” o ”Textual Entailment Recognition”, cuyo objetivo es establecer si la semántica de un texto se puede inferir de la semántica de otro texto. En este artículo, presentamos una nueva aproximación que utiliza la semántica latente y la medida de similitud del coseno para resolver el problema de la Implicación Textual. Para realizar la evaluación se han utilizado diferentes corpus y recursos, realizando posteriormente un estudio sobre el impacto de combinar la información semántica obtenida con un sistema de aprendizaje automático.
The variability of semantic expression is a special characteristic of natural language. This variability is challenging for many natural language processing applications that try to infer the same meaning from different text variants. In order to treat this problem a generic task has been proposed: Textual Entailment Recognition. In this paper, we present a new Textual Entailment approach based on Latent Semantic Indexing (LSI) and the cosine measure. This proposed approach extracts semantic knowledge from different corpora and resources. Our main purpose is to study how the acquired information can be combined with an already developed and tested Machine Learning system. The carried out experiments show that the combination of MLEnt, LSI and cosine measure improves the results of the initial approach.
Este trabajo ha sido parcialmente financiado por los proyectos CICyT número TIC2003-07158-C04-01 y PROFIT número FIT-340100-2004-14 y por el Gobierno Valenciano GV04B-276.
Idioma: Español

Artículos similares:

Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio
Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.
10