Descripción: |
El descubrimiento de conocimiento (KD Knowledge Discovery) consiste en la búsqueda de patrones interesantes y de regularidades importantes en grandes bases de información [Holsheimer y Siebes, 1991; Piatetski-Shapiro et al., 1991]. Al hablar de descubrimiento de conocimiento basado en sistemas inteligentes nos referimos específicamente a la aplicación de métodos de aprendizaje automático u otros métodos similares, para descubrir y enumerar patrones presentes en dicha información.
Un procedimiento recurrente a la hora de realizar descubrimiento de conocimiento basado en sistemas inteligentes consiste en tomar el conjunto de datos a estudiar, aplicar un algoritmo de agrupamiento [Kaski, 1997, Hall y Colmes, 2003] para separarlo en distintos grupos (clases) y sobre cada uno de ellos, intentar generar reglas que caractericen su conformación, utilizando otro algoritmo a tales efectos [Grosser et al., 2005; Felgaer et al., 2006; Cogliati et al., 2006].
Una de las opciones para llevar adelante el proceso de agrupamiento está dada por el uso de los mapas auto-organizados [Kohonen, 1982; 1990; 1995a, 1995b; Kohonen et al., 1996], los cuales consisten en un algoritmo de redes neuronales utilizado para una gran variedad de aplicaciones, principalmente para problemas de ingeniería, pero también para análisis de datos.
En cuanto a la inducción de reglas, dada la caracterización de las entidades que se utilizan comúnmente en descubrimiento de conocimiento, fuertemente basada en los valores de sus atributos y no en las relaciones establecidas entre estos, se suelen emplear métodos basados en atributos. Uno de los más claros y difundidos son los árboles de decisión o clasificación [Michalski et al, 1998; Grossman et al, 1999] en los cuales se cuenta con nodos que modelizan cada atributo, ramas que se originan en estos nodos, una por cada valor que el atributo puede tomar, y finalmente las hojas que corresponden a las clases individuales. Recorriendo un árbol desde su nodo padre hasta las distintas hojas, se pueden generar de forma muy simple las reglas a las cuales la clasificación responde. Una de las herramientas aplicadas al mencionado proceso es la familia de algoritmos TDIDT (Top Down Induction Decision Trees) [Quinlan, 1986; Servente y García-Martínez, 2002]. Sin embargo, estos pasos se realizan únicamente bajo la presunción de obtener un resultado representativo del conjunto de datos sobre el que se trabaja. Eje: Agentes y Sistemas Inteligentes |