Título: Automatic Semantic Role Labeling using Selectional Preferences with Very Large Corpora
Determinación Automática de Roles Semánticos usando Preferencias de Selección sobre Corpus muy Grandes
Autores: GELBUKH, ALEXANDER
CALVO, HIRMAN
Fecha: 1969-12-31
Publicador: Revistas UNAM
Fuente:
Tipo:
Tema: dependency parsing; pp attachment disambiguation; constituent to dependency conversion; heuristic rules; hybrid parser; selectional preferences
ANÁLISIS DE DEPENDENCIAS; DESAMBIGUACIÓN DE FRASE PREPOSICIONAL; CONVERSIÓN DE CONSTITUYENTES A DEPENDENCIAS; REGLAS HEURÍSTICAS; ANALIZADOR SINTÁCTICO HÍBRIDO; PREFERENCIAS DE SELECCIÓN
Descripción: WE PRESENT A METHOD FOR RECOGNIZING SEMANTIC ROLES FOR SPANISH SENTENCES. THIS METHOD IS BASED ON DEPENDENCY PARSING USING HEURISTIC RULES TO INFER DEPENDENCY RELATIONSHIPS BETWEEN WORDS, AND WORD CO-OCCURRENCE STATISTICS (LEARNT IN AN UNSUPERVISED MANNER) TO RESOLVE AMBIGUITIES SUCH AS PREPOSITIONAL PHRASE ATTACHMENT. IF A COMPLETE PARSE CANNOT BE PRODUCED, A PARTIAL STRUCTURE IS BUILT WITH SOME (IF NOT ALL) DEPENDENCY RELATIONS IDENTIFIED. EVALUATION SHOWS THAT IN SPITE OF ITS SIMPLICITY, THE PARSER'S ACCURACY IS SUPERIOR TO THE AVAILABLE EXISTING PARSERS FOR SPANISH. THOUGH CERTAIN GRAMMAR RULES, AS WELL AS THE LEXICAL RESOURCES USED, ARE SPECIFIC FOR SPANISH, THE SUGGESTED APPROACH IS LANGUAGE-INDEPENDENT. A PARTICULARLY INTERESTING AMBIGUITY WHICH WE HAVE DECIDED TO ANALYZE DEEPER, IS THE PREPOSITIONAL PHRASE ATTACHMENT DISAMBIGUATION. THE SYSTEM USES AN ORDERED SET OF SIMPLE HEURISTIC RULES FOR DETERMINING ITERATIVELY THE RELATIONSHIPS BETWEEN WORDS TO WHICH A GOVERNOR HAS NOT BEEN YET ASSIGNED. FOR RESOLVING CERTAIN CASES OF AMBIGUITY WE USE CO-OCCURRENCE STATISTICS OF WORDS COLLECTED PREVIOUSLY IN AN UNSUPERVISED MANNER, WHETHER IT BE FROM BIG CORPORA, OR FROM THE WEB (THROUGH A SEARCH ENGINE SUCH AS GOOGLE). COLLECTING THESE STATISTICS IS DONE BY USING SELECTIONAL PREFERENCES. IN ORDER TO EVALUATE OUR SYSTEM, WE DEVELOPED A METHOD FOR CONVERTING A GOLD STANDARD FROM A CONSTITUENT FORMAT TO A DEPENDENCY FORMAT. ADDITIONALLY, EACH ONE OF THE MODULES OF THE SYSTEM (SELECTIONAL PREFERENCES ACQUISITION AND PREPOSITIONAL PHRASE ATTACHMENT DISAMBIGUATION), IS EVALUATED IN A SEPARATE AND INDEPENDENT WAY TO VERIFY THAT THEY WORK PROPERLY. FINALLY WE PRESENT SOME APPLICATIONS OF OUR SYSTEM: WORD SENSE DISAMBIGUATION AND LINGUISTIC STEGANOGRAPHY.
SE PRESENTA UN MÉTODO PARA RECONOCER LOS ROLES SEMÁNTICOS DE LAS ORACIONES EN ESPAÑOL, ES DECIR, IDENTIFICAR EL PAPEL QUE TIENE CADA UNO DE LOS ELEMENTOS DE LA ORACIÓN. ESTE MÉTODO SE BASA EN ANÁLISIS DE DEPENDENCIAS USANDO REGLAS HEURÍSTICAS PARA INFERIR RELACIONES DE DEPENDENCIA ENTRE PALABRAS, ASÍ COMO ESTADÍSTICAS DE CO-OCURRENCIA (APRENDIDAS DE MANERA NO SUPERVISADA) PARA RESOLVER AMBIGÜEDADES COMO LA ADJUNCIÓN DE SINTAGMA PREPOSICIONAL. SI NO SE PUEDE PRODUCIR UN ANÁLISIS COMPLETO, SE CONSTRUYE UNA ESTRUCTURA PARCIAL CON ALGUNAS (SI NO TODAS) RELACIONES DE DEPENDENCIA IDENTIFICADAS. LA EVALUACIÓN MUESTRA QUE A PESAR DE SU SIMPLICIDAD, LA PRECISIÓN DEL ANALIZADOR ES SUPERIOR A AQUELLA DE LOS ANALIZADORES EXISTENTES ACTUALES PARA EL ESPAÑOL. A PESAR DE QUE CIERTAS REGLAS GRAMATICALES Y LOS RECURSOS LÉXICOS USADOS SON ESPECÍFICOS PARA EL ESPAÑOL, EL ENFOQUE SUGERIDO ES INDEPENDIENTE DEL LENGUAJE. UNA AMBIGÜEDAD INTERESANTE QUE HEMOS DECIDIDO ANALIZAR A MAYOR PROFUNDIDAD, ES LA DESAMBIGUACIÓN DE SINTAGMA PREPOSICIONAL. COMPUTACIÓN Y SISTEMAS VOL. 12 NO. 1, 2008, PP 128-150 ISSN 1405-5546 AUTOMATIC SEMANTIC ROLE LABELING USING SELECTIONAL PREFERENCES WITH VERY LARGE CORPORA 129 EL SISTEMA USA UN CONJUNTO ORDENADO DE REGLAS HEURÍSTICAS SIMPLES PARA DETERMINAR ITERATIVAMENTE LAS RELACIONES ENTRE PALABRAS PARA LAS CUALES NO SE LES HA ASIGNADO AÚN UN GOBERNANTE. PARA RESOLVER CIERTOS CASOS DE AMBIGÜEDAD USAMOS ESTADÍSTICAS DE CO-OCURRENCIAS DE PALABRAS. ESTAS ESTADÍSTICAS HAN SIDO OBTENIDAS PREVIAMENTE DE UNA MANERA NO SUPERVISADA, YA SEA A PARTIR DE GRANDES CORPUS DE TEXTO, O A TRAVÉS DE INTERNET (A TRAVÉS DE UN MOTOR DE BÚSQUEDA COMO GOOGLE). EL CONJUNTO DE ESTADÍSTICAS DE CO-OCURRENCIAS DE USO CONFORMAN UNA BASE DE DATOS DE PREFERENCIAS DE SELECCIÓN. PARA EVALUAR ESTE SISTEMA, DESARROLLAMOS UN MÉTODO PARA CONVERTIR UN ESTÁNDAR EXISTENTE, DE UN FORMATO DE CONSTITUYENTES A UN FORMATO DE DEPENDENCIAS. ADICIONALMENTE, CADA UNO DE LOS MÓDULOS DEL SISTEMA (ADQUISICIÓN DE PREFERENCIAS DE SELECCIÓN, DESAMBIGUACIÓN DE SINTAGMA PREPOSICIONAL) SE EVALÚA DE UNA FORMA SEPARADA E INDEPENDIENTE PARA VERIFICAR SU CORRECTO FUNCIONAMIENTO. FINALMENTE, PRESENTAMOS ALGUNAS APLICACIONES DE NUESTRO SISTEMA: DESAMBIGUACIÓN DE SENTIDOS DE PALABRAS Y ESTAGANOGRAFÍA LINGÜÍSTICA.
Idioma: Inglés

Artículos similares:

Ordered Hunt Schemes for Overlaid CDMA Cellular Systems,Esquemas de ordenamiento en sistemas celulares sobrepuestos CDMA por Castañeda Camacho, J; Benemérita Universidad Autónoma de Puebla, Puebla, México,Lara Rodríguez, D; IPN
Model for Adjustment of Aggregate Forecasts using Fuzzy Logic,Modelo para el ajuste de pronósticos agregados utilizando lógica difusa por Escobar Gómez, E N; Instituto Tecnológico de Tuxtla Gutiérrez Chiapas,Díaz Núñez, J J; Universidad Autónoma de Ciudad Juárez Chihuahua,Taracena Sanz, L F; Instituto Tecnológico de Querétaro, Querétaro
Volatile Organic Compound Emissions from Light-Duty Vehicles During Cold-Starts,Emisiones de compuestos orgánicos volátiles durante arranques en frío de automóviles ligeros por Mendoza Domínguez, A; Tecnológico de Monterrey, Campus Monterrey, Nuevo León, México,León Romero, M A; Tecnológico de Monterrey, Campus Monterrey, Nuevo León, México,Caballero Mata, P
Matrix Formulation of Foundations for Vibrating Machinery in Frequency Domain,Formulación matricial de cimentaciones para maquinaria vibratoria en el dominio de la frecuencia por Carbajal Romero, M F; Instituto Politécnico Nacional. México DF,Rodríguez Castellanos, A; Instituto Mexicano del Petróleo. México DF,Rodríguez Sánchez, J E; Instituto Mexicano del Petróleo. México DF,Flores Méndez, E; IPN
Hydrogen Sorption Properties of the Intermetallic Mg2Ni Obtained by Using a Simoloyer Ball Milling,Propiedades de ab-desorción de hidrógeno del intermetálico Mg2Ni obtenido empleando un molino de bolas Simoloyer por Martínez Franco, E; IPN,Klassen, T; GKSS, Research Center Geesthacht, Germany,Jaramillo Vigueras, D; IPN,Bormann, R; GKSS, Research Center Geesthacht, Germany
Numerical Approach to an Outflow Hydrograph of a Dambreak,Estimación numérica del hidrograma de salida de una presa debido a su ruptura por Fuentes Mariles, O A; Universidad Nacional Autónoma de México,Arganis Juárez, M L; UNAM,De Luna Cruz, F; UNAM,Franco, V; UNAM
Electrical Parameters Extraction of CMOS Floating-Gate Inverters,Extracción de parámetros eléctricos de inversores CMOS de compuerta flotante por Molinar Solís, J E; Universidad Autónoma del Estado de México,Ponce Ponce, V H; IPN,García Lozano, R Z; Universidad Autónoma del Estado de México,Díaz Sanchez, A; Instituto Nacional de Astrofísica, Óptica y Electrónica INAOE,Rocha Pérez, j M; Instituto Nacional de Astrofísica, Óptica y Electrónica INAOE
Back Work Ratio of Brayton Cycle,La relación de trabajo de retroceso de un ciclo Brayton por Malaver de la Fuente, M; Universidad Marítima del Caribe, Venezuela
Active Rectifier with Extended Functions: An Option to Voltage Sags Ride Through and Power Quality Improvement,Rectificador activo con funciones ampliadas: una alternativa para la compensación de sags de voltaje y mejorar la calidad de la red eléctrica por Núñez Gutiérrez, C A; Universidad Autónoma de San Luis Potosí, SLP,Lira Pérez, J; Universidad Autónoma de San Luis Potosí, SLP,Pazos Flores, F; Universidad Autónoma de San Luis Potosí, SLP,Echavarría Solís, R; Universidad Politécnica de Victoria, Ciudad Victoria, Tamaulipas
10