Título: Diseño de una base de datos tipo SpeechDat para el idioma gallego
Autores: González Rei, Begoña
García Mateo, Carmen
Fecha: 2007-09-25
2007-09-25
2000-09
Publicador: RUA Docencia
Fuente:
Tipo: info:eu-repo/semantics/article
Tema: Base de datos
SpeechDat
Lengua gallega
Muestras orales telefónicas
Etiquetado
Descripción: En la actualidad se está recogiendo una base de datos oral telefónica para el gallego. Se inserta dentro de las iniciativas de recogida de bancos de datos orales estándar del SpeechDat, concretamente en el proyecto SpeechDat(M), que recoge muestras de voz de aproximadamente 1000 hablantes que llaman desde un teléfono fijo (FDB, Fixed Data Base). El diseño de SpeechDat pretende ser general, es decir, por un lado válido para todas las lenguas representadas y, por otro, permitir distintas aproximaciones al problema del reconocimiento del habla (reconocimiento de palabras aisladas, conectadas y del discurso continuo). En este trabajo se describe el diseño de esta base de datos SpeechDat, reflejando la problemática de su adaptación al gallego y las novedades incluidas. Los temas que se van a abordar en esta comunicación son: a) el diseño de la base de datos, teniendo en cuenta los requisitos genéricos para todos los idiomas y la propia idiosincrasia del gallego; b) la adquisición de las muestras orales telefónicas, con una descripción tanto de la metodología como del sistema de grabación; c) el etiquetado del material oral, con la descripción del nivel de representación de los datos.
Este trabajo ha sido parcialmente financiado por la CICYT con el proyecto FEDER 1FD97-0077 "Sistemas de diálogo para el acceso telefónico a servicios telemáticos".
Idioma: Español

Artículos similares:

Choosing the correct paradigm for unknown words in rule-based machine translation systems por Sánchez Cartagena, Víctor Manuel,Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Pérez Ortiz, Juan Antonio
Using external sources of bilingual information for on-the-fly word alignment por Esplà Gomis, Miquel,Sánchez Martínez, Felipe,Forcada Zubizarreta, Mikel L.
10