Título: Aplicaciones de procesamiento de lenguaje natural
Autores: Hernández, Myriam
Gómez Soriano, José Manuel
Fecha: 2013-10-28
2013-10-28
2013-07
Publicador: RUA Docencia
Fuente:
Tipo: info:eu-repo/semantics/article
Tema: Procesamiento de lenguaje natural
Clasificadores
Categorizar
Etiquetar
Aprendizaje supervisado
Aprendizaje no supervisado
Aprendizaje automático
Natural language processing
Classify
Categorize
Tagging
Supervised learning
Unsupervised learning
Machine learning
Lenguajes y Sistemas Informáticos
Descripción: El campo de procesamiento de lenguaje natural (PLN), ha tenido un gran crecimiento en los últimos años; sus áreas de investigación incluyen: recuperación y extracción de información, minería de datos, traducción automática, sistemas de búsquedas de respuestas, generación de resúmenes automáticos, análisis de sentimientos, entre otras. En este artículo se presentan conceptos y algunas herramientas con el fin de contribuir al entendimiento del procesamiento de texto con técnicas de PLN, con el propósito de extraer información relevante que pueda ser usada en un gran rango de aplicaciones. Se pueden desarrollar clasificadores automáticos que permitan categorizar documentos y recomendar etiquetas; estos clasificadores deben ser independientes de la plataforma, fácilmente personalizables para poder ser integrados en diferentes proyectos y que sean capaces de aprender a partir de ejemplos. En el presente artículo se introducen estos algoritmos de clasificación, se analizan algunas herramientas de código abierto disponibles actualmente para llevar a cabo estas tareas y se comparan diversas implementaciones utilizando la métrica F en la evaluación de los clasificadores.
The field of natural language processing (NLP) has grown tremendously in recent years, its research interests include: information retrieval and extraction, data mining, machine translation systems, question answering systems, automatic summarization, sentiment analysis, among others. In this paper we present some concepts and tools in order to contribute to the understanding of text processing with NLP techniques, to extract relevant information that can be used in a wide range of applications. Automatic classifiers can be developed to categorize documents and recommend labels, these classifiers should be platform independent, easily customizable in order to be integrated in different projects and to be able to learn from examples. In this article we introduce the algorithms for classification, we discuss some open source tools currently available to perform these tasks and different implementations are compared using F metrics to evaluate classifiers.
Este trabajo ha sido parcialmente financiado por el proyecto LEGOLANG (TIN2012-31224) y el proyecto TEXTMESS 2.0 (TIN2009-13391-C04- 01) del gobierno español.
Idioma: Español

Artículos similares:

Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio
Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.
10