Título: Disentangling the Wikipedia Category Graph for Corpus Extraction
Autores: Ngonga Ngomo,Axel-Cyrille
Schumacher,Frank
Fecha: 2009-06-01
Publicador: SCIELO
Fuente:
Tipo: journal article
Tema: Natural language processing
local graph clustering
corpus extraction
Descripción: In several areas of research such as knowledge management and natural language processing, domain-specific corpora are required for tasks such as terminology extraction and ontology learning. The presented investigations herein are based on the assumption that Wikipedia can be used for the purpose of corpus extraction. It presents the advantage of possessing a semantic layer, which should ease the extraction of domain-specific corpora. Yet, as the Wikipedia category graph is scale-free, it can not be used as it is for these purposes. In this paper, we propose a novel approach to graph clustering called BorderFlow, which we use and evaluate on the Wikipedia category graph. Additional possible applications of these results in the area of information retrieval are presented.
Idioma: Inglés

Artículos similares:

Fracturas maxilofaciales y factores asociados en derechohabientes del IMSS Campeche, México: Análisis retrospectivo 1994-1999 por Medina-Solis,Cario Eduardo,Córdova-González,José Luis,Casanova-Rosado,Alejandro José,Zazueta-Hernández,Maria Alejandra
Factores de riesgo de mortalidad en el hijo de madre toxémica por Gómez-Gómez,Manuel,Danglot-Banck,Cecilia,García-de la Torre,Guadalupe Silvia,Antonio-Ocampo,Abdiel,Fajardo-Gutiérrez,Arturo,Sánchez-García,Maria Luisa,Ahumada-Ramírez,Elias
Cerámicas mexicanas para cicatrización de piel por Piña-Barba,María Cristina,Tejeda-Cruz,Adriana,Regalado-Hernández,Miguel Ángel,Arenas-Reyes,María Isabel,Martín-Mandujano,Salvador,Montalvo,César
Seguimiento de egresados de un diplomado en enseñanza de la Medicina por Ponce de León-Castañeda,Ma. Eugenia,Ruíz-Alcocer,Ma. del Carmen,Lozano-Sánchez,J. Rogelio
Primer estudio de teledermatología en México: Una nueva herramienta de salud pública por Lepe,Verónica,Moneada,Benjamín,Castanedo-Cázares,Juan Pablo,Martínez-Rodríguez,Alejandra,Mercado-Ceja,Sergio M,Gordillo-Moscoso,Antonio
10