Metabuscador

Inicio Atrás
Título:	Un corpus anotado de 100.000.000 palabras del español histórico y moderno
Autores:	Davies, Mark
Fecha:	2007-09-12 2007-09-12 2002-09
Publicador:	RUA Docencia
Fuente:
Tipo:	info:eu-repo/semantics/article
Tema:	Corpus Histórico Base de datos relacional Historical Relational database
Descripción:	En http://www.corpusdelespanol.org se encuentra el Corpus del Español – 100.000.000 palabras en el primer corpus anotado del español histórico y moderno. A diferencia de otros corpus del español histórico, el “Corpus del Español” permite búsquedas por 35 categorías gramaticales, 20.000 lemas, y 30.000 grupos de sinónimos y antónimos, además de búsquedas por etimología, frecuencia, y por categorías semánticas y sintácticas creadas por el usuario mismo. Con todo esto, puede haber búsquedas tan complejas como “complemento directo pronominal + todas las formas de cualquier sinónimo de querer + infinitivo, que ocurre en el siglo XX pero no en los siglos XIII o XIX”. También se pueden producir fácilmente listados completos de colocaciones. La flexibilidad y el poder del corpus (juntos con la velocidad– menos de 2-3 segundos para casi todas las búsquedas) se deben a la arquitectura innovadora del corpus – varias bases de datos relacionales que están ligadas y que tienen anotación para los 45.000.000 n-grams distintos en el corpus. The first annotated corpus of historical and modern Spanish – the 100,000,000 word Corpus del Español – is now online at http://www.corpusdelespanol.org. Unlike other corpora of historical Spanish, the “Corpus del Español” allows searches by 35 grammatical categories, 20,000 lemmata, and 30,000 groups of synonyms and antonyms, in addition to searches by etymology, frequency, and by user-defined semantic and syntactic categories. All of this allows searches as complex as “pronominal direct object + all forms of any synonym of querer + infinitive, which occurs in the 1900s but not in the 1700s or 1800s”. It is also possible to easily produce complete lists of collocations. The flexibility and power of the corpus (as well as the speed – 2-3 seconds for nearly all searches) are due to the innovative architecture of the corpus – several relational databases that are linked together and which contain annotation for the 45,000,000 distinct n-grams in the corpus.
Idioma:	Español

1 Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio	6 Análisis Real de Varias Variables II. Problemas (27-3-2013) por Conde Calero, Juan Manuel
2 Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.	7 Introducción a mirada/s trans/identitarias,Introduction to trans-identitary look(s) por Amaro Quintas, Ángel Manuel
3 Motivos del creciente uso de traducción automática seguida de posedición,Motius del creixent ús de la traducció automàtica seguida de postedició,Reasons for the increasing use of machine translation followed by post-editing por Sánchez Martínez, Felipe	8 El «romance familiar» sale del armario: la fantasía femenina en Sévigné (Julia Berkowitz),The “family romance” comes out of the closet: the female fantasy in Sévigné (Julia Berkowitz) por Ituarte Pérez, Leire
4 Nuevas perspectivas sobre las relaciones púnicas con la costa ibérica del sureste peninsular,New perspectives on Punic relations with the Iberian coast of Peninsular Southeast por Sala Sellés, Feliciana	9 De la tradición sáfica a los círculos tribádicos: la búsqueda de las identidades lésbicas desde una perspectiva histórica (De la antigüedad clásica a la edad moderna),From the Sapphic tradition to the tribadic circles: the search of lesbic identities from a historical perspective (From antiquity to the modern age) por Beteta Martín, Yolanda
5 Los espacios periurbanos en el área ibérica contestana: las novedades y algunas reflexiones históricas por Sala Sellés, Feliciana	10 Matrimonio igualitario y parentesco: discursos, hegemonías y acontecimiento,Egalitarian marriage and kinship: discourses, hegemony and event por Buzaglo, Analía,Morandi, Mariela,Culla, Mónica