Título: Un análisis comparativo de estrategias para la categorización semántica de textos cortos
A comparative analysis of strategies for semantic short-text categorization
Autores: Rosas, María Verónica
Errecalde, Marcelo Luis
Rosso, Paolo
Fecha: 2010-05-03
2010-05-03
2010-04
Publicador: RUA Docencia
Fuente:
Tipo: info:eu-repo/semantics/article
Tema: Categorización de textos
Desambiguación
Ontología
Colecciones de textos cortos
Text categorization
Word sense disambiguation
Ontology
Short-text corpora
Lenguajes y Sistemas Informáticos
Descripción: La categorización de textos cortos es, hoy en día un área importante de investigación debido a que gran parte de la información que recibimos y con la cual trabajamos habitualmente tiene esta característica (e-mails, mensajes de texto, resúmenes de noticias, entre otros). Distintos trabajos han reportado resultados interesantes en la categorización de textos incorporando información semántica a la representación de los documentos. Sin embargo, estos trabajos no se han concentrado en general en las particularidades que presentan los textos cortos. Por otra parte, los métodos de desambiguación más difundidos (basados en corpus) no siempre son adecuados en los dominios que se intentan abordar. En estos casos, la desambiguación basada en conocimiento se convierte en una alternativa interesante a considerar. En este trabajo, estudiamos la efectividad de la categorización de textos cortos, cuando se utiliza información semántica obtenida con métodos basados en conocimiento. Los resultados obtenidos con este enfoque muestran mejoras interesantes que incentivan a continuar con esta línea de investigación.
Nowadays, short-texts categorization is an important research area because most of the information we usually receive and work with have this characteristic (e-mails, text messages, news, etc.). Different studies have reported interesting results in text categorization by adding semantic information to documents’ representation. However, these studies have not focused on the particularities that short texts introduce. Furthermore, the most popular disambiguation methods (corpus-based methods) not always are feasible to use in these domains. Thus, knowledge-based disambiguation methods become interesting alternatives in these cases. In this article, we study the effectiveness of short text categorization, when semantic information, obtained by knowledge-based methods, is used. The results obtained with this approach show interesting improvements that encourage to continue this line of research.
Proyecto TEXT-ENTERPRISE 2.0 (TIN2009-13391-C04-03).
Idioma: Español

Artículos similares:

Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio
Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.
10