Título: Construcción rápida de un sistema de traducción automática español-portugués partiendo de un sistema español-catalán
Autores: Gilabert Zarco, Patricia
Herrero Vicente, Javier
Ortiz Rojas, Sergio
Pertusa Ibáñez, Antonio
Ramírez Sánchez, Gema
Sánchez Martínez, Felipe
Samper Asensio, Marcial
Antunes-Gonçalves Scalco, Miriam
Forcada Zubizarreta, Mikel L.
Fecha: 2007-09-06
2007-09-06
2003-09
Publicador: RUA Docencia
Fuente:
Tipo: info:eu-repo/semantics/article
Tema: Traducción automática
Desarrollo rápido
Lengua española
Lengua portuguesa
Machine translation
Rapid development
Spanish language
Portuguese language
Descripción: Se describe el proceso seguido para construir rápidamente un sistema de traducción automática español–portugués y portugués–español, partiendo de un sistema existente que traduce entre el castellano y el catalán. Un equipo de cuatro desarrolladores ha producido en seis meses un sistema ya utilizable, con una cobertura de texto superior al 95% y con una tasa de texto erróneo en torno al 10%, y que traduce miles de palabras por segundo. Este proceso ha sido facilitado en gran parte por la existencia de un ingenio (“motor”) de traducción independiente de los datos lingüísticos (un sistema clásico de transferencia) y de compiladores para convertir los datos lingüísticos en los formatos usados por este ingenio, y, por otro lado, por la existencia de datos lingüísticos de naturaleza morfológica para ambas lenguas.
This paper describes the rapid construction of a Spanish–Portuguese, Portuguese–Spanish machine translation system, starting from an existing system for the Spanish–Catalan pair, developed by the same research group. A team of four developers has produced in six months a useful system having a text coverage above 95% and a word error rate around 10% running at thousand of words a second. The process has partly been made easier, on the one hand, by the existence of a translation engine independent from the linguistic data and the availability of compilers to turn the linguistic data into the formats used by the engine, and, on the other hand, by the availability of morphological data for both languages.
Trabajo financiado por Portal Universia, S.A., con apoyo de la Comisión Interministerial de Ciencia y Tecnología a través del proyecto TIC2000-1599-C02-01.
Idioma: Español

Artículos similares:

Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio
Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.
10