Título: Una gramática de estilos para resumir textos en español
Autores: Contreras Zambrano, Hilda Yelitza
Dávila, Jacinto
Fecha: 2007-03-19
2007-03-19
2007-03-19
2002-05-27
2007-03-19
Publicador: Universidad de los Andes Venezuela
Fuente:
Tipo:
Tema: Resumen Automático de textos
Lingüística Computacional
Lingüística Textual
Extracción de Información
Procesamiento del lenguaje natural
Centro de Simulación y Modelos (CESIMO)
Postgrado en Computación
Facultad de Ingeniería
Automatic Text Summarization
Text Linguistics
Information extraction
Ciencias Computacionales
Artículos
Descripción: Una gramática de estilos para resumir textos en español (Jacinto A. Dávila Quintero, Hilda Y. Contreras Zambrano) Resumen Este artículo presenta un experimento lingüístico que consiste en resumir textos escritos en español. El resumen es realizado con una herramienta computacional que aplica técnicas simbólicas basadas en una "gramática de estilos". Esta gramática modela las reglas de estilo para la escritura propuestas por Williams (1990). El programa puede obtener desde los tópicos de las oraciones de cada párrafo y reconocer elementos sintáctico-estructurales de cohesión y coherencia textual, hasta los tópicos más importantes del párrafo. Se aprovechan estos resultados para construir un resumen con oraciones asociadas a dichos tópicos. Esta versión inicial de nuestro resumidor muestra como en base a reglas lógicas para definir estilos y "tópicos" se pueden obtener resúmenes de textos "aceptables" por expertos en el dominio de conocimiento de los textos. También se sugiere que aplicando estos modelos podemos obtener resultados reduciendo la complejidad del procesamiento morfológico, sintáctico y semántico tradicional. Abstract This paper describes an experiment on text summarization. A summary is made by means of a logic program executed by a computer. The logic program is an embodiment of a symbolic technique for natural language processing based on "style grammars". These grammars, in turn, are based on a proposal by J. Williams (1990). The program obtains topics (the themes of the sentence, according to Williams) from each sentence in a paragraph and check its syntax and structure for cohesion and structural coherence. It ends with a proposal for the most important topic of the paragraph, which can be used as a building block for a summary. The main outcome of this work is the evidence that a set of rules, written in the language of logic, can embody style criteria, produce "topics" for texts in Spanish and lead to a tractable, computational implementation. Publicado en la Revista de la Sociedad Española para el Procesamiento del Lenguaje Natural, Revista nº 29, septiembre de 2002
hyelitza@ula.ve
jacinto@ula.ve
Nivel monográfico
Idioma: Español