Título: Procesamiento del lenguaje natural basado en una "gramática de estilos" para el idioma español
Natural language processing based on "grammars of style" for Spanish language
Autores: Contreras Zambrano, Hilda Yelitza
Dávila, Jacinto
Fecha: 2007-03-19
2007-03-19
2007-03-19
2001-09-01
2007-03-19
Publicador: Universidad de los Andes Venezuela
Fuente:
Tipo:
Tema: Procesamiento del lenguaje natural
Lingüística Computacional
Recuperación de información
Inteligencia artificial
Centro de Simulación y Modelos (CESIMO)
Postgrado en Computación
Facultad de Ingeniería
Natural language processing
Computational linguistics
Information retrieval
Artificial intelligent
Ciencias Computacionales
Artículos
Descripción: Procesamiento del lenguaje natural basado en una "gramática de estilos" para el idioma español (Jacinto A. Dávila Quintero, Hilda Y. Contreras Zambrano) Resumen Este artículo presenta un proyecto de investigación que pretende desarrollar una herramienta para interpretar documentos en español y extraer de ellos descriptores relevantes. Los problemas de procesar el lenguaje natural y de extraer información, han sido atacados desde hace varias décadas [13], [2], [18]. Sin embargo, las investigaciones no han sido suficientes para diseñar un sistema que interprete el lenguaje natural con un rendimiento cercano al de un humano. El lenguaje natural escapa a todos los esfuerzos de tratamiento computacional, al parecer, debido a que el conocimiento lingüístico está asociado de formas sutiles y desconocidas con el conocimiento contextual que tiene el hablante [15]. En este trabajo abordaremos el problema de la interpretación del lenguaje escrito usando gramáticas de estilos y formas lógicas. La gramática de estilo se inspira en las reglas de estilo que propone J. Williams [16] para escribir prosa en inglés. Esta estrategia adaptada al español y la definición de un buen descriptor, tienen la finalidad de reducir la complejidad del procesamiento sintáctico/semántico tradicional; Además de incorporar el conocimiento contextual en el proceso. Validaremos la estrategia con un prototipo de un módulo de asignación de descriptores para un sistema bibliográfico virtual. Abstract This paper describes an experiment on text summarization. A summary is made by means of a logic program executed by a computer. The logic program is an embodiment of a symbolic technique for natural language processing based on "style grammars". These grammars, in turn, are based on a proposal by J. Williams (1990). The program obtains topics (the themes of the sentence, according to Williams) from each sentence in a paragraph and check its syntax and structure for cohesion and structural coherence. It ends with a proposal for the most important topic of the paragraph, which can be used as a building block for a summary. The main outcome of this work is the evidence that a set of rules, written in the language of logic, can embody style criteria, produce "topics" for texts in Spanish and lead to a tractable, computational implementation. Publicado en CLEI-2001
hyelitza@ula.ve
jacinto@ula.ve
Nivel monográfico
Idioma: Español