Título: Sistema de acceso a la información basado en conceptos utilizando Freebase en español-inglés sobre el dominio médico y turístico
Information access system based on concepts using Freebase in Spanish-English over the domain medical and tourist
Autores: Muñoz Gil, Rafael
Aparicio Galisteo, Fernando
Buenaga Rodríguez, Manuel de
Fecha: 2012-09-07
2012-09-07
2012-09
Publicador: RUA Docencia
Fuente:
Tipo: info:eu-repo/semantics/article
Tema: Extracción de información
Integración de información
Bases de datos colaborativas
Procesado de textos
Arquitectura escalar
Freebase
Information extraction
Information integration
Collaborative databases
Text processing
Scalable architecture
Lenguajes y Sistemas Informáticos
Descripción: En este artículo presentamos una herramienta de acceso a la información, basado en los conceptos, enfocada tanto a textos médicos como turísticos. Usando técnicas para el marcado de entidades reconocidas, el sistema permite extraer conceptos relevantes para aportar más información sobre ellos utilizando bases de conocimiento colaborativas y ontologías. Componentes especialmente interesantes para el desarrollo del sistema son Freebase, una gran base de conocimiento colaborativa, además de recursos formales como MedlinePlus y PubMed. La arquitectura del sistema ha sido construida pensando en términos de escalabilidad, para constituir una gran plataforma de integración de información, con los siguientes objetivos: permitir la integración de diferentes técnicas de procesamiento de lenguaje natural y ampliar las fuentes desde las que se extrae información, así como facilitar la integración de nuevas interfaces de usuario.
In this paper we present a tool for access to information, based on semantic, focused both medical texts and tourists. Using marking techniques for recognized entities, the system can extract relevant concepts to provide more information about them, using collaborative databases and ontologies. Particularly relevant components to its the development are Freebase, a large collaborative base of knowledge and formal resources such as MedlinePlus and PubMed. The platform architecture has been built thinking in terms of scalability, in order to constitute a great platform for information integration, with the following objectives: to allow the integration of different natural language processing techniques, to expand the sources from which information extraction can be performed and to ease integration of new user interfaces.
Esta investigación ha sido financiada por el Ministerio de Ciencia y Tecnología Español MEDICAL-MINER (TIN-2009-14057-C03-01) y por la Comunidad de Madrid bajo el auspicio de la red de investigación MA2VICMR (S2009/TIC-1542).
Idioma: Español

Artículos similares:

Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio
Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.
10