Título: Using Machine Learning for Extracting Information from Natural Disaster News Reports
Usando Aprendizaje Automático para Extraer Información de Noticias de Desastres Naturales
Autores: Téllez Valero, Alberto
Montes y Gómez, Manuel
Villaseñor Pineda, Luis
Fecha: 2010-04-27
Publicador: Revistas UNAM
Fuente:
Tipo:
Tema: Machine Learning; Information Extraction; Text Categorization; Natural Disasters; Databases
Aprendizaje Automático; Extracción de Información; Clasificación Temática de Textos; Desastres Naturales; Bases de Datos
Descripción: THE DISASTERS CAUSED BY NATURAL PHENOMENA HAVE BEEN PRESENT ALL ALONG HUMAN HISTORY; NEVERTHELESS, THEIR CONSEQUENCES ARE GREATER EACH TIME. THIS TENDENCY WILL NOT BE REVERTED IN THE COMING YEARS; ON THE CONTRARY, IT IS EXPECTED THAT NATURAL PHENOMENA WILL INCREASE IN NUMBER AND INTENSITY DUE TO THE GLOBAL WARMING. BECAUSE OF THIS SITUATION IT IS OF GREAT INTEREST TO HAVE SUFFICIENT DATA RELATED TO NATURAL DISASTERS, SINCE THESE DATA ARE ABSOLUTELY NECESSARY TO ANALYZE THEIR IMPACT AS WELL AS TO ESTABLISH LINKS BETWEEN THEIR OCCURRENCE AND THEIR EFFECTS. IN ACCORDANCE TO THIS NECESSITY, IN THIS PAPER WE DESCRIBE A SYSTEM BASED ON MACHINE LEARNING METHODS THAT IMPROVES THE ACQUISITION OF NATURAL DISASTER DATA. THIS SYSTEM AUTOMATICALLY POPULATES A NATURAL DISASTER DATABASE BY EXTRACTING INFORMATION FROM ONLINE NEWS REPORTS. IN PARTICULAR, IT ALLOWS EXTRACTING INFORMATION ABOUT FIVE DIFFERENT TYPES OF NATURAL DISASTERS: HURRICANES, EARTHQUAKES, FOREST FIRES, INUNDATIONS, AND DROUGHTS. EXPERIMENTAL RESULTS ON A COLLECTION OF SPANISH NEWS SHOW THE EFFECTIVENESS OF THE PROPOSED SYSTEM FOR DETECTING RELEVANT DOCUMENTS ABOUT NATURAL DISASTERS (REACHING AN F-MEASURE OF 98%), AS WELL AS FOR EXTRACTING RELEVANT FACTS TO BE INSERTED INTO A GIVEN DATABASE (REACHING AN F-MEASURE OF 76%).
LOS DESASTRES CAUSADOS POR FENÓMENOS NATURALES HAN ESTADO PRESENTES DESDE EL PRINCIPIO DE LA HISTORIA DEL HOMBRE; SIN EMBARGO, SUS CONSECUENCIAS SON CADA VEZ MAYORES. ESTA TENDENCIA PODRÍA NO SER REVERTIDA EN LOS PRÓXIMOS AÑOS; AL CONTRARIO, SE ESPERA QUE LOS FENÓMENOS NATURALES PUEDAN INCREMENTAR EN NÚMERO E INTENSIDAD DEBIDO AL CALENTAMIENTO GLOBAL. A CAUSA DE ESTA SITUACIÓN ES DE GRAN INTERÉS TENER SUFICIENTES DATOS RELACIONADOS A LOS DESASTRES NATURALES, YA QUE ESTOS DATOS SON ABSOLUTAMENTE NECESARIOS PARA ANALIZAR SU IMPACTO ASÍ COMO PARA ESTABLECER CONEXIONES ENTRE SU OCURRENCIA Y SUS EFECTOS. EN CORRESPONDENCIA CON ESTA NECESIDAD, EN ESTE ARTÍCULO DESCRIBIMOS UN SISTEMA BASADO EN MÉTODOS DE APRENDIZAJE AUTOMÁTICO QUE MEJORA LA ADQUISICIÓN DE DATOS DE DESASTRES NATURALES. ESTE SISTEMA AUTOMÁTICAMENTE LLENA UNA BASE DE DATOS DE DESASTRES NATURALES CON LA INFORMACIÓN EXTRAÍDA DE NOTICIAS DE PERIÓDICOS EN LÍNEA. EN PARTICULAR, ESTE SISTEMA PERMITE EXTRAER INFORMACIÓN ACERCA DE CINCO TIPOS DE DESASTRES NATURALES: HURACANES, TEMBLORES, INCENDIOS FORESTALES, INUNDACIONES Y SEQUÍAS. LOS RESULTADOS EXPERIMENTALES EN UNA COLECCIÓN DE NOTICIAS EN ESPAÑOL MUESTRAN LA EFICACIA DEL SISTEMA PROPUESTO TANTO PARA DETECTAR DOCUMENTOS RELEVANTES SOBRE DESASTRES NATURALES (ALCANZANDO UNA MEDIDA-F DE 98%), ASÍ COMO PARA EXTRAER HECHOS RELEVANTES PARA SER INSERTADOS EN UNA BASE DE DATOS DADA (ALCANZANDO UNA MEDIDA-F DE 76%).
Idioma: Inglés

Artículos similares:

Ordered Hunt Schemes for Overlaid CDMA Cellular Systems,Esquemas de ordenamiento en sistemas celulares sobrepuestos CDMA por Castañeda Camacho, J; Benemérita Universidad Autónoma de Puebla, Puebla, México,Lara Rodríguez, D; IPN
Model for Adjustment of Aggregate Forecasts using Fuzzy Logic,Modelo para el ajuste de pronósticos agregados utilizando lógica difusa por Escobar Gómez, E N; Instituto Tecnológico de Tuxtla Gutiérrez Chiapas,Díaz Núñez, J J; Universidad Autónoma de Ciudad Juárez Chihuahua,Taracena Sanz, L F; Instituto Tecnológico de Querétaro, Querétaro
Volatile Organic Compound Emissions from Light-Duty Vehicles During Cold-Starts,Emisiones de compuestos orgánicos volátiles durante arranques en frío de automóviles ligeros por Mendoza Domínguez, A; Tecnológico de Monterrey, Campus Monterrey, Nuevo León, México,León Romero, M A; Tecnológico de Monterrey, Campus Monterrey, Nuevo León, México,Caballero Mata, P
Matrix Formulation of Foundations for Vibrating Machinery in Frequency Domain,Formulación matricial de cimentaciones para maquinaria vibratoria en el dominio de la frecuencia por Carbajal Romero, M F; Instituto Politécnico Nacional. México DF,Rodríguez Castellanos, A; Instituto Mexicano del Petróleo. México DF,Rodríguez Sánchez, J E; Instituto Mexicano del Petróleo. México DF,Flores Méndez, E; IPN
Hydrogen Sorption Properties of the Intermetallic Mg2Ni Obtained by Using a Simoloyer Ball Milling,Propiedades de ab-desorción de hidrógeno del intermetálico Mg2Ni obtenido empleando un molino de bolas Simoloyer por Martínez Franco, E; IPN,Klassen, T; GKSS, Research Center Geesthacht, Germany,Jaramillo Vigueras, D; IPN,Bormann, R; GKSS, Research Center Geesthacht, Germany
Numerical Approach to an Outflow Hydrograph of a Dambreak,Estimación numérica del hidrograma de salida de una presa debido a su ruptura por Fuentes Mariles, O A; Universidad Nacional Autónoma de México,Arganis Juárez, M L; UNAM,De Luna Cruz, F; UNAM,Franco, V; UNAM
Electrical Parameters Extraction of CMOS Floating-Gate Inverters,Extracción de parámetros eléctricos de inversores CMOS de compuerta flotante por Molinar Solís, J E; Universidad Autónoma del Estado de México,Ponce Ponce, V H; IPN,García Lozano, R Z; Universidad Autónoma del Estado de México,Díaz Sanchez, A; Instituto Nacional de Astrofísica, Óptica y Electrónica INAOE,Rocha Pérez, j M; Instituto Nacional de Astrofísica, Óptica y Electrónica INAOE
Back Work Ratio of Brayton Cycle,La relación de trabajo de retroceso de un ciclo Brayton por Malaver de la Fuente, M; Universidad Marítima del Caribe, Venezuela
Active Rectifier with Extended Functions: An Option to Voltage Sags Ride Through and Power Quality Improvement,Rectificador activo con funciones ampliadas: una alternativa para la compensación de sags de voltaje y mejorar la calidad de la red eléctrica por Núñez Gutiérrez, C A; Universidad Autónoma de San Luis Potosí, SLP,Lira Pérez, J; Universidad Autónoma de San Luis Potosí, SLP,Pazos Flores, F; Universidad Autónoma de San Luis Potosí, SLP,Echavarría Solís, R; Universidad Politécnica de Victoria, Ciudad Victoria, Tamaulipas
10