Título: Procesamiento del lenguaje natural basado en una "gramática de estilos" para el idioma español.
Autores: Contreras Zambrano, Hilda Yelitza
Fecha: 2007-06-20
2007-06-20
2007-06-20
2001-03-01
2007-06-20
Publicador: Universidad de los Andes Venezuela
Fuente:
Tipo:
Tema: Procesamiento del lenguaje natural
Lingüística Computacional
Facultad de Ingeniería
Ciencias Computacionales
Trabajos de investigación
Descripción: Procesamiento del lenguaje natural basado en una "gramática de estilos" para el idioma español. (Contreras Zambrano, Hilda Yelitza) Resumen Los problemas de procesar el lenguaje natural y de extraer información, han sido atacados desde hace varías décadas y el presente documento hace una revisión de estos intentos. Sin embargo, las investigaciones no han sido suficientes para diseñar un sistema que rinda como un humano al interpretar lenguaje natural. El lenguaje natural escapa a todos los esfuerzos de tratamiento computacional, al parecer, debido a que el conocimiento lingüístico está asociado, de formas sutiles y desconocidas, con el conocimiento contextual que tiene el hablante. El presente trabajo es la investigación previa del estado del arte de esta área de conocimiento, para abordar posteriormente el problema específico del procesamiento del lenguaje natural en forma escrito y la extracción de información a partir colecciones de textos. Este proyecto pretenderá desarrollar una herramienta para interpretar documentos en español y extraer de ellos buenos descriptores.
1.- Introducción: ¿Qué pretende el proyecto?
2.- Marco Teórico: ¿En qué se basa?
2.1. Recuperación de Información.
2.1.1. Minería de Texto.
2.1.2. Extracción de Información.
2.2. Procesamiento del Lenguaje Natural.
2.2.1. Lingüística Computacional.
2.2.2. El Lenguaje desde el punto de vista científico.
2.2.3. Problemas en el uso del Lenguaje Natural.
2.3. Modelos del NLP.
2.3.1. Modelo Simbólico.
2.3.1.1. Fundamentos teóricos: gramáticas formales.
Gramáticas regulares o de estados finitos.
Gramáticas Independientes del Contexto.
Gramáticas de Unificación y Rasgos.
2.3.1.2. Estructura de un sistema PLN simbólico.
2.3.1.3. Ejemplo de modelos simbólicos: una gramática para el español.
2.3.2. Modelo Estadístico.
2.3.2.1. Modelos estadísticos en CL.
Técnicas básicas, estimación y evaluación de probabilidades.
Modelo de N-gramas.
2.3.2.2. Ejemplo de modelos estadísticos: una gramática probabilística
para el español.
2.3.3. Modelo Biológico.
2.3.3.1. Redes neuronales.
2.3.3.2. La computación evolutiva: Algoritmos genéticos.
2.3.3.3. Ejemplo de modelos biológicos: tratamiento de fonemas en español.
2.3.4. Comparación de los modelos de NLP.
2.4. Revisión Histórica del NLP.
3.- Definición del Problema.
4.- Metodología: ¿Cómo? ¿Cuál es la Estrategia?
5.- Conclusiones.
hyelitza@ula.ve
Nivel monográfico
ING-0003
Idioma: Español