Título:
Clasificación de textos en lenguaje natural usando la Wikipedia

Autores: Quinteiro-González, Jose María; 1 IUMA Sistemas de Información y Comunicaciones. División Tecnología de la Información, Universidad de Las Palmas de Gran Canaria, Campus Universitario de Tafira, 35017 - Las Palmas de Gran Canaria, España. 2 Departamento de Ingeniería Telemática, Universidad de Las Palmas de Gran Canaria, Campus Universitario de Tafira, 35017 - Las Palmas de Gran Canaria, España.
Martel-Jordán, Ernestina
Hernández-Morera, Pablo
Ligero-Fleitas, Juan A.
López-Rodriguez, Aaron
Fecha: 2011-12-01
Publicador: Iberian Journal of Information Systems and Technologies
Fuente:
Tipo:


Tema: Text Categorization; Wikipedia; tf-idf; Machine Learning; Natural Language Processing
Categorización de textos; Wikipedia; tf-idf; Aprendizaje Automático; Procesado de Lenguaje Natural

Descripción: Automatic Text Classifiers are needed in environments where the amount of data to handle is so high that human classification would be ineffective. In our study, the proposed classifier takes advantage of the Wikipedia to generate the corpus defining each category. The text is then analyzed syntactically using Natural Language Processing software. The proposed classifier is highly accurate and outperforms Machine Learning trained classifiers.
La clasificación de textos, en entornos en los que el volumen de datos a clasificar es tan elevado que resulta muy costosa la realización de esta tarea por parte de humanos, requiere la utilización de clasificadores de textos en lenguaje natural automáticos. El clasificador propuesto en el presente estudio toma como base la Wikipedia para la creación del corpus que define una categoría mediante técnicas de Procesado de Lenguaje Natural (PLN) que analizan sintácticamente los textos a clasificar. El resultado final del sistema propuesto presenta un alto porcentaje de acierto, incluso cuando se compara con los resultados obtenidos con técnicas alternativas de Aprendizaje Automático.
La clasificación de textos, en entornos en los que el volumen de datos a clasificar es tan elevado que resulta muy costosa la realización de esta tarea por parte de humanos, requiere la utilización de clasificadores de textos en lenguaje natural automáticos. El clasificador propuesto en el presente estudio toma como base la Wikipedia para la creación del corpus que define una categoría mediante técnicas de Procesado de Lenguaje Natural (PLN) que analizan sintácticamente los textos a clasificar. El resultado final del sistema propuesto presenta un alto porcentaje de acierto, incluso cuando se compara con los resultados obtenidos con técnicas alternativas de Aprendizaje Automático.
Idioma: Español

Artículos similares:

Editorial por Reis, Luís Paulo; Universidade do Minho
,Análisis de Decisiones en la Selección de Proveedores de Tecnologías de la Información: Una Revisión Sistemática, por Grossi, Lucas,Calvo-Manzano, Jose A.; Facultad de Informática, Universidad Politécnica de Madrid, 28660, Boadilla del Monte
Sistema de Información del Banco de Tierras de Galicia por Porta, Juan,Parapar, Jorge,García, Paula,Fernández, Gracia,Toriño, Juan,Ónega, Francisco,Díaz, Pablo,Miranda, David,Crecente, Rafael
Algoritmo de Recomendação Baseado em Passeios Aleatórios num Grafo Bipartido,Algoritmo de Recomendação Baseado em Passeios Aleatórios num Grafo Bipartido por Gama, Ricardo,André, Nuno,Pereira, César; Centro de Estudos em Educação, Tecnologias e Saúde, ESTGL, Instituto Politécnico de Viseu Av. Coronel José Maria V. de Andrade, Campus Politécnico, 3504-510 VISEU,Almeida, Luís,Pinto, Pedro
iLeger: Uma proposta de Mediação Digital para Períodos Eleitorais por Sousa, Artur Afonso de,Gouveia, Luís Borges
,SCODA para el Desarrollo de Sistemas Multiagente, por Román, Jesús A.; E. P. S. de Zamora (Universidad de Salamanca), 49022, Zamora,Tapia, Dante I.; Universidad de Salamanca, 37008, Salamanca,Corchado, Juan M.; Universidad de Salamanca, 37008, Salamanca
Evaluación de la Privacidad de una Red Social Virtual por Fernández, J. R. Coz,Chamorro, E. Fojón,Gil, R. Heradio,Somolinos, J. A. Cerrada
,Análise de opiniões expressas nas redes sociais por Teixeira, Diogo,Azevedo, Isabel
10