Título: Uso de grafos de conceptos para la generación automática de resumenes en biomedicina
Concept-graphs based biomedical automatic summarization using UMLS
Autores: Plaza Morales, Laura
Díaz Esteban, Alberto
Gervás Gómez-Navarro, Pablo
Fecha: 2008-11-11
2008-11-11
2008-09
Publicador: RUA Docencia
Fuente:
Tipo: info:eu-repo/semantics/article
Tema: Generación automática de resúmenes
Unified Medical Language System (UMLS)
Redes libres de escala
Artículo biomédico
Ontología
Automatic summarization
Degree-based methods
Scale-free network
Biomedical article
Ontology
Descripción: Uno de los principales problemas en la investigación sobre generación automática de resúmenes (GAR) es la falta de utilización de conocimiento de dominio, que se refleja en la incorrecta interpretación semántica del documento y la baja calidad de los resúmenes obtenidos. En este trabajo se propone un método de extracción de oraciones para la GAR de artículos biomédicos, mediante el mapeo del documento a los conceptos de la ontología UMLS, y la representación del documento y de sus oraciones como grafos. La selección de las oraciones relevantes se realiza a partir de la conectividad de los conceptos que contienen en el grafo del documento. Se muestran los resultados empíricos preliminares de la aplicación de distintas heurísticas para la selección de las oraciones del resumen, y se identifican algunos problemas y líneas de trabajo futuras.
One of the main problems in research on automatic summarization is the inaccurate semantic interpretation of the source, which is reflected in the deficiencies shown by the resulting summaries. Using specific domain knowledge, as that supplied by ontologies, can considerably alleviate the problem. In this paper, we introduce an ontology-based extractive method for summarization. It is based on mapping the text to concepts in the ontology and representing the document as a scale-free graph. To assess the importance of the sentences we compute the centrality of their concepts in the text. We have applied our approach to summarize scientific biomedical literature, taking advantage from free resources as UMLS. Preliminary empirical results are presented and pending problems are identified.
Esta investigación está financiada por el Ministerio de Educación y Ciencia (TIN2006-14433-C02-01) y la Universidad Complutense de Madrid y la Dirección General de Universidades e Investigación de la Comunidad Autónoma de Madrid (CCG07-UCM/TIC- 2803).
Idioma: Español

Artículos similares:

Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio
Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.
10