Metabuscador

Inicio Atrás
Título:	Consultas degradadas en recuperación de información textual Corrupted queries in text retrieval
Autores:	Otero Pombo, Juan Vilares Ferro, Jesús Vilares Ferro, Manuel
Fecha:	2009-05-19 2009-05-19 2009-03
Publicador:	RUA Docencia
Fuente:
Tipo:	info:eu-repo/semantics/article
Tema:	n-gramas de caracteres Consultas degradadas Recuperación de información Corrección ortográfica Character n-grams Degraded queries Information retrieval Spelling correction Lenguajes y Sistemas Informáticos
Descripción:	En este artículo proponemos dos alternativas para el tratamiento de consultas degradadas en aplicaciones de Recuperación de Información en español. La primera de ellas es una estrategia basada en n-gramas de caracteres e independiente del conocimiento y recursos lingüísticos disponibles. Como segunda alternativa, proponemos a su vez dos técnicas de corrección ortográfica, integrando una de ellas un modelo estocástico que debe ser entrenado previamente a partir de un texto etiquetado. Con el fin de estudiar su validez, se ha diseñado un marco de pruebas sobre el que se han evaluado ambas aproximaciones. In this paper, we propose two different alternatives to deal with degraded queries on Spanish Information Retrieval applications. The first is based on character n-grams, and has no dependence on the linguistic knowledge and resources available. In the second, we propose two spelling correction techniques, one of which has a strong dependence on a stochastic model that must be previously built from a PoStagged corpus. In order to study their validity, a testing framework has been designed and applied on both approaches for evaluation. Este trabajo ha sido parcialmente subvencionado por el Ministerio de Educación y Ciencia y FEDER (a través de los proyectos de investigación HUM2007-66607-C04-02 y HUM2007-66607-C04-03), y por la Xunta de Galicia (a través de los proyectos 05PXIC30501PN, 07SIN005206PR, INCITE07PXI104119ES y la ”Red Gallega de PLN y RI”).
Idioma:	Español

1 Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio	6 Análisis Real de Varias Variables II. Problemas (27-3-2013) por Conde Calero, Juan Manuel
2 Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.	7 Introducción a mirada/s trans/identitarias,Introduction to trans-identitary look(s) por Amaro Quintas, Ángel Manuel
3 Motivos del creciente uso de traducción automática seguida de posedición,Motius del creixent ús de la traducció automàtica seguida de postedició,Reasons for the increasing use of machine translation followed by post-editing por Sánchez Martínez, Felipe	8 El «romance familiar» sale del armario: la fantasía femenina en Sévigné (Julia Berkowitz),The “family romance” comes out of the closet: the female fantasy in Sévigné (Julia Berkowitz) por Ituarte Pérez, Leire
4 Nuevas perspectivas sobre las relaciones púnicas con la costa ibérica del sureste peninsular,New perspectives on Punic relations with the Iberian coast of Peninsular Southeast por Sala Sellés, Feliciana	9 De la tradición sáfica a los círculos tribádicos: la búsqueda de las identidades lésbicas desde una perspectiva histórica (De la antigüedad clásica a la edad moderna),From the Sapphic tradition to the tribadic circles: the search of lesbic identities from a historical perspective (From antiquity to the modern age) por Beteta Martín, Yolanda
5 Los espacios periurbanos en el área ibérica contestana: las novedades y algunas reflexiones históricas por Sala Sellés, Feliciana	10 Matrimonio igualitario y parentesco: discursos, hegemonías y acontecimiento,Egalitarian marriage and kinship: discourses, hegemony and event por Buzaglo, Analía,Morandi, Mariela,Culla, Mónica