- Inicio
- Atrás
|
Título: |
ClInt: a bilingual Spanish-Catalan spoken corpus of clinical interviews ClInt: un corpus oral bilingüe español-catalán de entrevistas clínicas |
Autores: |
Vila Rigat, Marta González Fuente, Santiago Martí Antonín, Maria Antònia Llisterri Boix, Joaquim Machuca Ayuso, María Jesús |
Fecha: |
2010-10-11 2010-10-11 2010-10 |
Publicador: |
RUA Docencia |
Fuente: |
|
Tipo: |
info:eu-repo/semantics/article |
Tema: |
Corpus oral Corpus bilingüe Entrevista clínica Spoken corpus Bilingual corpus Clinical interview Lenguajes y Sistemas Informáticos |
Descripción: |
En este artículo se presenta ClInt (Clinical Interview), un corpus oral bilingüe español-catalán que contiene un total de 15 horas de entrevistas clínicas. Está formado por archivos sonoros alineados con transcripciones a varios niveles que comprenden información ortográfica, fonética y morfológica, además de codificación lingüística y extralingüística. Se trata de un recurso hasta el momento inexistente para estas lenguas que ofrece múltiples posibilidades de explotación desde una amplia variedad de disciplinas, tanto las vinculadas a la Lingüística como las que se relacionan con el Procesamiento del Lenguaje Natural. In this paper we present ClInt (Clinical Interview), a bilingual Spanish-Catalan spoken corpus that contains 15 hours of clinical interviews. It consists of audio files aligned with multiple-level transcriptions comprising orthographic, phonetic and morphological information, as well as linguistic and extralinguistic encoding. This is a previously non-existent resource for these languages and it offers a wide-ranging exploitation potential in a broad variety of disciplines such as Linguistics, Natural Language Processing and related fields. This work is supported by the FPU Grant AP2008-02185 from the Spanish Ministry of Education, and the Text-Knowledge 2.0 (TIN2009-13391-C04-04) and ClInt (FFI2009-06252-E/FILO) projects. |
Idioma: |
Inglés |