Título: Lazy Query Expansion
Autores: GELBUKH , ALEXANDER
Fecha: 1969-12-31
Publicador: Revistas UNAM
Fuente:
Tipo:
Tema: BASE DE DATOS DOCUMENTAL; RECUPERACION DE INFORMACION; EXPANSION DE PETICION; LENGUAJE NATURAL
Descripción: EQUIVALENCE OF SOME STRINGS. THESE ARE LOWERCASE VERUS UPPERCASE MATCHING, MORPHOLOGICAL INFLECTION, DERIVATION, AND SYNONYMY OF WORDS: E.G. GIVE A QUERY COMPUTER, FIND COMPUTER COMPUTING, WORKSTATION. THE LATTER PROBLEMS ARE VERY IMPORTANT IN LANGUAGES WITH RICHER MORPHOLOGY AND LESS STABLE TERMINOLOGY THAN IN ENGLISH. ALSO MUCH BETTER RECALL IS ACHIEVED BY MATCHING HYPONYMS AND HYPERNYMS USING THIS CON BE HANDLED AT THE TIME OF INDEXING BY REDUCING RELATED STRINGS TO A COMMON FORM, OR AT THE TIME OF QUERY PROCESSING BY EXPANDING THE QUERY WITH THE WHOLE SET OF THE RELATED FORMS. WE ARGUE FOR THET THE LATTER WAY ALLOWS FOR GREATTER FLEXIBILITY AND EASIER MAINTENACE, WHITE BEING MORE AFFORDABLE THAT IT IS USUALLY CONSIDERED. WE PROPOSE TO EXP
UN SISTEMA DE RECUPERACIÓN DE INFORMACIÓN O SISTEMA DE BASE DE DATOS DOCUMENTAL TIENE QUE EVALUAR DE ALGUNA FORMA LA EQUIVALENCIA DE CADENAS. POR EJEMPLO, CADENAS EN MINÚSCULAS VERSUS CADENAS CON MAYÚSCULAS O MIXTAS, LAS CADENAS CON DIFERENCIAS EN FLEXIONES MORFOLÓGICAS O DERIVACIÓN MORFOLÓGICA, LOS CASOS DE SINONIMIA DE PALABRAS: DIGAMOS, PARA LA PETICIÓN COMPUTER, SE PUEDE ENCONTRAR TAMBIÉN LAS PALABRAS COMPUTERS, COMPUTING, WORKSTATION. LOS ASUNTOS RELACIONADOS CON MORFOLOGÍA SON MUY IMPORTANTES PARA LOS IDIOMAS CON LA MORFOLOGÍA MAS DESARROLLADA Y LA TERMINOLOGÍA MENOS ESTABLE QUE LO TIENE EL INGLES. TAMBIÉN SE PUEDE OBTENER MEJOR RELEVANCIA DE DOCUMENTOS RECUPERADOS (RECALL) USANDO HIPONIMOS E HIPERONIMOS DE ALGÚN TESAURO POR EJEMPLO PARA LA PETICIÓN COMPUTERS TAMBIÉN ENCONTRAR LAS PALABRAS SUPERCOMPUTER, MICROCOMPUTER, MAINFRAME, MACHINE, DEVAICE, ROCESSOR, INUX, ETC. TÉCNICAMENTE, SE PUEDE MANEJAR ESTO EN EL MOMENTO DE INDEXAR, REDUCIENDO LAS CADENAS RELACIONADAS A UNA FORMA COMÚN, O EN EL MOMENTO DE PROCESAR LA PETICIÓN AGREGANDO LAS CADENAS RELACIONADAS CON CADA PALABRA A LA PETICIÓN. MOSTRAMOS QUE EL ULTIMO MÉTODO ES MAS FLEXIBLE Y FÁCIL DE MANEJAR, AL MISMO TIEMPO SIENDO POSIBLE DE IMPLEMENTARSE (LO QUE DIFIERE DE PUNTO DE VISTA TRADICIONAL). PROPONEMOS EXPANDIR LA PETICIÓN SOLAMENTE CON LAS PALABRAS QUE REALMENTE SE ENCUENTRAN EN LA BASE DE DATOS, EN EL TESAURO DESARROLLADO PARA EL SENADO DE LA REPUBLICA MEXICANA, DEMUESTRA QUE EXISTE UN INCREMENTO INSIGNIFICATIVO DE TAMAÑO DE LAS PETICIONES REALES DE LOS USUARIOS EN PROMEDIO BASE DE DATOS, LA CUAL CONTIENE ALREDEDOR DE 200MB DE DOCUMENTOS A PESAR DE QUE EL ESPAÑOL ES UN LENGUAJE CON MORFOLOGÍA BASTANTE DESARROLLADA.
Idioma: Inglés

Artículos similares:

Ordered Hunt Schemes for Overlaid CDMA Cellular Systems,Esquemas de ordenamiento en sistemas celulares sobrepuestos CDMA por Castañeda Camacho, J; Benemérita Universidad Autónoma de Puebla, Puebla, México,Lara Rodríguez, D; IPN
Model for Adjustment of Aggregate Forecasts using Fuzzy Logic,Modelo para el ajuste de pronósticos agregados utilizando lógica difusa por Escobar Gómez, E N; Instituto Tecnológico de Tuxtla Gutiérrez Chiapas,Díaz Núñez, J J; Universidad Autónoma de Ciudad Juárez Chihuahua,Taracena Sanz, L F; Instituto Tecnológico de Querétaro, Querétaro
Volatile Organic Compound Emissions from Light-Duty Vehicles During Cold-Starts,Emisiones de compuestos orgánicos volátiles durante arranques en frío de automóviles ligeros por Mendoza Domínguez, A; Tecnológico de Monterrey, Campus Monterrey, Nuevo León, México,León Romero, M A; Tecnológico de Monterrey, Campus Monterrey, Nuevo León, México,Caballero Mata, P
Matrix Formulation of Foundations for Vibrating Machinery in Frequency Domain,Formulación matricial de cimentaciones para maquinaria vibratoria en el dominio de la frecuencia por Carbajal Romero, M F; Instituto Politécnico Nacional. México DF,Rodríguez Castellanos, A; Instituto Mexicano del Petróleo. México DF,Rodríguez Sánchez, J E; Instituto Mexicano del Petróleo. México DF,Flores Méndez, E; IPN
Hydrogen Sorption Properties of the Intermetallic Mg2Ni Obtained by Using a Simoloyer Ball Milling,Propiedades de ab-desorción de hidrógeno del intermetálico Mg2Ni obtenido empleando un molino de bolas Simoloyer por Martínez Franco, E; IPN,Klassen, T; GKSS, Research Center Geesthacht, Germany,Jaramillo Vigueras, D; IPN,Bormann, R; GKSS, Research Center Geesthacht, Germany
Numerical Approach to an Outflow Hydrograph of a Dambreak,Estimación numérica del hidrograma de salida de una presa debido a su ruptura por Fuentes Mariles, O A; Universidad Nacional Autónoma de México,Arganis Juárez, M L; UNAM,De Luna Cruz, F; UNAM,Franco, V; UNAM
Electrical Parameters Extraction of CMOS Floating-Gate Inverters,Extracción de parámetros eléctricos de inversores CMOS de compuerta flotante por Molinar Solís, J E; Universidad Autónoma del Estado de México,Ponce Ponce, V H; IPN,García Lozano, R Z; Universidad Autónoma del Estado de México,Díaz Sanchez, A; Instituto Nacional de Astrofísica, Óptica y Electrónica INAOE,Rocha Pérez, j M; Instituto Nacional de Astrofísica, Óptica y Electrónica INAOE
Back Work Ratio of Brayton Cycle,La relación de trabajo de retroceso de un ciclo Brayton por Malaver de la Fuente, M; Universidad Marítima del Caribe, Venezuela
Active Rectifier with Extended Functions: An Option to Voltage Sags Ride Through and Power Quality Improvement,Rectificador activo con funciones ampliadas: una alternativa para la compensación de sags de voltaje y mejorar la calidad de la red eléctrica por Núñez Gutiérrez, C A; Universidad Autónoma de San Luis Potosí, SLP,Lira Pérez, J; Universidad Autónoma de San Luis Potosí, SLP,Pazos Flores, F; Universidad Autónoma de San Luis Potosí, SLP,Echavarría Solís, R; Universidad Politécnica de Victoria, Ciudad Victoria, Tamaulipas
10