Título: Características de tiempo-frecuencia para la estimación de la posición de los órganos articuladores en consonantes explosivas
Time-Frequency Energy Features for Articulator Position Inference on Stop Consonants
Autores: Sepulveda-Sepulveda, Alexander; Universidad Nacional, sede Manizales
Castellanos-Domínguez, German; Universidad Nacional, sede Manizales
Fecha: 2012-11-30
Publicador: Revista Ingeniería y ciencia
Fuente:
Tipo: info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion




Tema: Computer science; Biomedical engineering
inversión articulatoria, modelos de mezclas Gaussianas, fonética articulatoria, características de tiempo-frecuencia.
Artificial intelligence; Pattern recognition, speech recognition; biological signal processing
acoustic-to-Articulatory inversion, Gaussian mixture models, articulatory phonetics, time-frequency features.
Descripción: La inversión articulatoria ofrece nuevas perspectivas y aplicaciones interesantes en el campo de la voz; sin embargo, es aún un problema por resolver. El presente trabajo ofrece un método para la estimación de la distribución de la información articulatoria contenida en la acústica de consonantes explosivas, cuya parametrización se realiza mediante la transformada wavelet packet. El trabajo se centra principalmente en estimar la información acústica relevante, en términos de asociación estadística, para la inferencia de la posición de los órganos articuladores críticos involucrados en la producción de consonantes explosivas. Se usa el coeficiente de Kendall a modo de medida de relevancia. Los mapas de relevancia de tiempo-frecuencia se calculan para la base de datos MOCHA–TIMIT; de la cual, las zonas correspondientes a las consonantes explosivas son analizados. El método propuesto entrega un conjunto de componentes de tiempo-frecuencia intimamente relacionados al fenómeno articulatorio, lo cual ofrece un entendimiento más profundo de la relación existente entre los fenómenos articulatorio y acústico. Los mapas de relevancia se prueban en un sistema de inversión articulatoria basado en modelos de mezclas gausianas, donde se muestra que mejoran el desempeño de los mencionados sistemas aplicados sobre consonantes explosivas. El método se puede extender a otras categorías articulatorias, p.e. fricativas, con el fin de adaptar el presente método a sistemas de inversión articulatoria sobre voz continua
Acoustic-to-Articulatory inversion offers new perspectives and interesting applicationsin the speech processing field; however, it remains an open issue. Thispaper presents a method to estimate the distribution of the articulatory informationcontained in the stop consonants’ acoustics, whose parametrizationis achieved by using the wavelet packet transform. The main focus is on measuringthe relevant acoustic information, in terms of statistical association, forthe inference of the position of critical articulators involved in stop consonantsproduction. The rank correlation Kendall coefficient is used as the relevancemeasure. The maps of relevant time–frequency features are calculated for theMOCHA–TIMIT database; from which, stop consonants are extracted andanalysed. The proposed method obtains a set of time–frequency componentsclosely related to articulatory phenemenon, which offers a deeper understandinginto the relationship between the articulatory and acoustical phenomena.The relevant maps are tested into an acoustic–to–articulatory mapping systembased on Gaussian mixture models, where it is shown they are suitable for improvingthe performance of such a systems over stop consonants. The method could be extended to other manner of articulation categories, e.g. fricatives,in order to adapt present method to acoustic-to-articulatory mapping systemsover whole speech.
Idioma: Inglés

Artículos similares:

El problema de π-geografía y el problema de Hurwitz,The π-geography problem and the Hurwitz problem por Cadavid-M., Carlos A; Universidad EAFIT,Vélez-C., Juan D.; Universidad Nacional de Colombia, Medellín
Navegation system for tubular upper digestive tract,Sistema de navegación tubular para vías digestivas altas por Mora, Andrea Del Mar Casallas; Universidad Manuela Beltran,Serrato, Lerly Yulieth Amaris; Universidad Manuela Beltran,Gaitán, Cindy Lizeth Carvajal; Universidad Manuela Beltran,Cifuentes, Camilo Andrés Rojas; Universidad Manuela Beltran
Estimación de la similitud semántica de tareas entre procesos de negocio de telecomunicaciones,Semantic similarity estimation of tasks between telecommunications business processes por Ordóñez Ante, Leandro; Grupo de Ingeniería Telemática Universidad del Cauca,Bastidas Narváez, Adriana X; Grupo de Ingeniería Telemática Universidad del Cauca,Corrales, Juan Carlos; Grupo de Ingeniería Telemática Universidad del Cauca
Simulación de propiedades mecánicas demulticapas de Zr/ZrN y TiN/ZrNempleando el método de elementos finitos,Simulation of mechanical properties of Zr/ZrN and TiN/ZrN multilayers using the finite elements method por Aristizábal–Soto, H. D.; Universidad Nacional de Colombia,Agudelo, L. C.; Universidad Nacional de Colombia,Bedoya Hincapié, C. M.; Universidad Nacional de Colombia,Restrepo Parra, E.; Universidad Nacional de Colombia
10 
Desarrollo de una plataforma de diseño e ingeniería naval,Desarrollo de una plataforma de diseño e ingeniería naval por Leiceaga Baltar, Xoan A.; Universidade de Vigo,Prieto, J.; Universidade de Vigo,Rodríguez, M.; Universidade de Vigo,Zapatero, F. G.; Universidade de Vigo,Soto, E.; Universidade de Vigo,Teijeiro, M.; Universidade de Vigo.