Título: Word combinations as an important part or modern electronic dictionaries
Autores: Bolshakov, Igor Alekseevich
Gelbukh Khan, Alexander Felixovitch
Fecha: 2007-09-12
2007-09-12
2002-09
Publicador: RUA Docencia
Fuente:
Tipo: info:eu-repo/semantics/article
Tema: Lexicografía computacional
Colocaciones
Subcategorización
Atracción léxica
Terminología
Computational lexicography
Collocations
Subcategorization
Lexical attraction
Terminology
Descripción: Se dan argumentos a favor de que las colecciones de las combinaciones de palabras significativas en los diccionarios electrónicos modernos del uso general se deben extender en lo máximo posible. Igor Mel'cuk clasifica las combinaciones de palabras en frasemas completos, semifrasemas (las combinaciones con las funciones léxicas) y combinaciones libres. Nuestra propuesta es obvia para los frasemas completos y semifrasemas. Sin embargo, las combinaciones con las funciones léxicas no estándares que son poco estudiadas y difíciles de detectar, así como las combinaciones terminológicas, también se deben describir e incluir ya que son altamente dependientes del lenguaje. Adicionalmente, proponemos unas reglas heurísticas para incluir en los diccionarios las combinaciones libres de palabras. Según nuestra experiencia con la base de datos de combinaciones de palabras CrossLexica, estas reglas no causan incremento significativo alguno del promedio de las combinaciones por palabra significativa, gracias a la selectividad semántica mutua de las palabras a combinar.
It is argued that the collections of combinations of content words in the modern general-purpose electronic dictionaries are to be broadened as much as possible. Igor Mel'cuk classifies word combinations into complete phrasemes, semi-phrasemes (combinations with lexical functions), and free combinations. Our suggestion is obvious for complete phrasemes and semi-phrasemes; however, combinations with nonstandard lexical functions, poorly studied and difficult to detect, as well as terminological combinations, are also to be acquired since they are highly language-specific. In addition, we propose heuristic rules for including free word combinations into dictionaries. According to our experience with the CrossLexica word combination database, these rules do not cause any significant growth of the mean number of combinations per content word because of the mutual semantic selectivity of the words to be combined.
Work done under partial support of Mexican Government (CONACyT and SNI) and CGEPI-IPN, Mexico.
Idioma: Inglés

Artículos similares:

Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio
Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.
10